


























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Unidad 1 sobre moda, media, varianza, etc
Tipo: Apuntes
1 / 34
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Es la rama de las matemáticas que examina las formas de analizar y procesar datos.
Mark L. Berenson - Estudio de los datos cuantitativos de la población, de los recursos naturales e
industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.
Diccionario de la real academia de la lengua española - Rama de la matemática que utiliza grandes
conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.
La estadística puede presentarse en diferentes niveles de dificultad matemática y puede estar dirigida hacia
aplicaciones en distintos campos de la investigación. De acuerdo con esto, se han escrito muchos libros de texto
sobre estadística empresarial, estadística educativa, estadística médica, estadística psicológica,…, e inclusive sobre
estadística para historiadores.
Para quienes están en el área de la investigación de mercados, la estadística es de gran ayuda en el momento de
determinar qué tan probable es que un producto nuevo sea exitoso. La estadística también es muy útil para evaluar
las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal, y los
fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico.
Incluso un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento,
considera la estadística una aliada imprescindible.
Así pues, la teoría general de la estadística es aplicable a cualquier campo científico en el cual se hacen
observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos del
conocimiento, sean éstos de nivel técnico o científico.
La estadística es la ciencia que tiene que ver con la (1) recolección, (2) organización, (3) presentación, (4) análisis,
e (5) interpretación de datos.
Aunque en todo estudio estadístico el primer paso es la recolección de datos, es usual en un curso básico de
estadística asumir que los datos ya han sido recolectados y que ahora están disponibles.
Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa
y descriptiva. Los datos deben colocarse en un orden lógico que revele rápida y fácilmente el mensaje que
contienen.
Este procedimiento constituye el proceso de la estadística descriptiva, luego que los datos se han organizado y se
han presentado para su revisión, el estadístico debe analizarlos e interpretarlos. Estos procedimientos se basan en
la estadística inferencial y constituyen un importante beneficio para el análisis estadístico, mediante la ayuda en
el proceso de toma de decisiones y solución de problemas.
Toda empresa que se enfrenta a las presiones competitivas debe beneficiarse considerablemente de la capacidad
para anticipar las condiciones del negocio, antes de que éstas ocurran. Si una empresa sabe cómo van a estar sus
ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes más exactos y efectivos respecto
a las operaciones actuales.
Si se calculan las ventas futuras con un grado de exactitud confiable, la gerencia puede tomar fácilmente decisiones
importantes respecto a los niveles de inventario, pedidos de materia prima, contrataciones de empleados y,
virtualmente, sobre cada aspecto de las operaciones del negocio.
Población (o universo)
Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio.
Es la totalidad de elementos o cosas bajo consideración.
Por ejemplo:
Todos los empleados
Todos los productos
Todas las calificaciones
Muestra
Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población
Es la porción de la población que se selecciona para su análisis.
Por ejemplo:
Los empleados de la empresa X (o del área Y)
Los productos de limpieza
Las calificaciones aprobatorias
Datos
Son medidas o valores susceptibles de ser observados y contados. Para hacer un análisis estadístico, es necesario
hacer una recopilación de datos.
Caracteres
Son los aspectos que deseamos estudiar. Cada carácter puede tomar distintos valores o modalidades. Una variable
estadística recorre todos los valores de un cierto carácter.
Variable
Es una característica de la población que se está analizando en un estudio estadístico; pueden ser:
Cuantitativas. Si pueden expresarse numéricamente. Se clasifican en variables discretas y continuas:
Si la variable puede tomar cualesquiera de todos los valores, teóricamente posibles, entre dos
valores dados es continua (Pueden tomar todos los valores de un intervalo)
En caso que pueda tomar sólo valores enteros se dice que la variable es discreta (Toman valores
numéricos aislados)
Ejemplos:
El peso de las personas (variable continua porque alguien puede pesar 70.85 Kg, es decir un valor
entre 70 y 71)
El número de habitantes por vivienda (variable discreta porque sólo se pueden utilizar números
enteros para contabilizar a las personas)
El ingreso monetario de las familias (variable continua porque también hay números
fraccionarios), etc.
Cuando se desea comparar varias distribuciones similares con distinto número de elementos, se debe recurrir a
las frecuencias relativas. Estas vienen dadas en “tanto por uno” (fr) o en “tantos por ciento” (%). Si N es el número
de individuos:
f
100 ∗
fri
N
Te sirve para representar que trozo de pastel ocupa la frecuencia absoluta que has calculado.
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
xi fi
xi fi fri % fri
En una distribución de frecuencias, se llama frecuencia relativa acumulada, Fi , correspondiente al valor i-ésimo, xi,
a la suma de la frecuencia de ese valor con todas las anteriores:
i
= f 1
f 2
.... + f i
Fr i
Fi
% acum. = Fri x 100
xi fi fri % fri Fi Fi acumulada
Este tipo de tablas de frecuencias se utiliza con variables discretas
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar
un mejor análisis e interpretación de ellos.
frecuencia absoluta ( fi) correspondiente a cada intervalo, contando la cantidad de datos cuyo valor está entre los
extremos del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es pertinente.
clase se emplean si las variables toman un número grande de valores o la variable es continua).
lo contrario es ideal que sea un número impar por ejemplo 5, 7, 9) obteniéndose así la amplitud o tamaño de
cada intervalo.
valor la amplitud para obtener el extremo superior y así sucesivamente.
Método Sturges : k = 1 + 3,332 log n
donde:
k= número de clases
n= tamaño muestral
Amplitud = =
Por lo tanto la amplitud de cada intervalo será de _______ 9
tienen los datos o según la precisión con que se desea trabajar.
3° Ahora podemos comenzar a construir la tabla de frecuencias:
Hay distintas formas de construir los intervalos dependiendo del tipo de variable que estemos trabajando.
a) Variables cuantitativas discretas : solo pueden tomar un número finito de valores. Siendo por lo general estos
valores los números naturales 1, 2, 3...
Un ejemplo son el número de hijos, el número de habitaciones de una vivienda, el número de matrimonios de una
persona..
Cuando categorizamos variables discretas los límites de clase son idénticos a los límites reales. Por ejemplo, el
número de personas que viven en una familia podemos agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna
familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.
b) Variables cuantitativas continuas : Las variables continuas, por el contrario, pueden, tomar un número infinito
de valores en cualquier intervalo dado.
En este caso los valores se agrupan en intervalos cuyos límites inferior y superior serían los siguientes:
Inferior: Lii
Superior: Lsi- 1
Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha, es decir que el extremo
inferior está incluido en el intervalo, pero el extremo superior no.
Es importante mencionar que las clases o intervalos para las variables continuas pueden ser de tres tipos:
Abiertas : clases abiertas tienen límites determinados (a,b) , pero los valores que la contienen comprenden valores
muy cercanos a estos límites sin comprenderlos a ellos mismos, esto se representa con un intervalo definido entre
paréntesis (). Esto quiere decir que esta clase contiene valores desde a hasta b pero no contiene exactamente a ni
b solo valores muy cercanos. (1, 10)
Cerradas : las clases cerradas, además de los valores que están entre a y b, los contiene a ellos, y se representa con
corchetes [a,b].
Semiabiertas: pueden contener a o b más los valores que están entre ellos, y se puede representar con un corchete
y un paréntesis, por ejemplo, (a,b] , en este caso no contiene el valor a y si los valores de b, además de los valores
que están entre estos.
Se construye la tabla con el último método explicado.
Intervalo Edades Frecuencia
absoluta (fi)
Frecuencia
relativa (fri) %
Frecuencia
acumulada (Fi)
Frecuencia
relativa
acumulada
1 1 - 10
2 11 - 20
3 21 - 30
4 31 - 40
5 41 - 50
6 51 - 60
7 61 - 70
8 71 - 80
Amplitud 9
- Marca clase o centro de la clase: es la semisuma de los límites de cada clase. Representa a todos los datos que
están contenidos en una clase. (punto medio de cada intervalo)
Responder las siguientes preguntas:
a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que el dato lo obtenemos de la columna de la
frecuencia absoluta.
Por lo tanto, la respuesta es _______ personas.
b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que el dato lo obtenemos de la columna de
frecuencia absoluta acumulada.
En este caso es el intervalo ________. Por lo tanto, la respuesta es ___________ personas tienen 60 o menos años.
c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona consultada, esta tenga entre 11 y 20 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que el dato lo obtenemos de la columna de
frecuencia relativa.
En este caso es el intervalo ________________, ya que es ahí donde se encuentran las edades entre
Entonces La probabilidad es _________________.
Por último vamos a repasar el concepto de:
Frecuencia relativa acumulada (Hi), Es la probabilidad de observar un valor menor o igual al valor que toma la
variable en estudio en ese intervalo.
- Histograma:
En el eje de las X: Se representan los valores de la variable
En el eje de las Y: Se representan los valores de la frecuencia: f, fr ó %
Se levanta para cada valor del intervalo de la X un rectángulo de altura la frecuencia de dicho intervalo.
Si unimos mediante una poligonal los puntos medios más altos de cada uno de dichos rectángulos obtenemos
el polígono de frecuencias.
- Diagrama de barras acumuladas:
En el eje de las X: Se representan los valores de la variable
En el eje de las Y: Se representan los valores de la frecuencia acumulada: F, Fr ó %
Se levanta para cada valor del intervalo de la X un rectángulo de altura la frecuencia acumulada de dicho
valor.
Si unimos mediante una poligonal las diagonales de dichos rectángulos obtenemos el polígono de frecuencias
acumuladas.
- Diagrama de sectores:
Como en las cualitativas
- En los histogramas, en el eje de las Y, en vez de representar la frecuencia se representa la densidad de frecuencia:
d i
=
f i
a i
Siendo a i
la amplitud de dicho intervalo, para que así la frecuencia coincida con el área del rectángulo.
- Los histogramas acumulados y los diagramas de sectores, iguales.
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
Li- 1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi-- 1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
fi
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.
xi fi Xi *fi
Propiedades de la media aritmética
misma igual a cero.
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
a. 8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
b. = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.
aritmética queda aumentada en dicho número.
aritmética queda multiplicada por dicho número.
Observaciones sobre la media aritmética
pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
xi fi
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último
intervalo
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística.
La varianza se representa por.
el cuadrado de dicho número.
calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la varianza
elevadas al cuadrado.
La desviación típica es la raíz cuadrada de la varianza
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
Desviación típica para datos agrupados
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
Calcular la desviación típica de la distribución de la tabla:
xi fi Xi * fi Xi
2
Propiedades de la desviación típica
dicho número.
La primera distribución presenta mayor dispersión.
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
centrales.
7, 8, 9, 10, 11, 12 Me= 9.
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre.
L i
es el límite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
Fi- 1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
fi Fi
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes
iguales.
Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
2
coincide con la mediana.
Distinguimos los casos en que los datos están agrupados en frecuencias y los que no lo están. Los datos también
pueden estar agrupados en intervalos de valores.
Por ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es
¿Qué se hace en el caso de que nos dé un número decimal?
Diferenciaremos dos casos:
Sin parte decimal: elegimos ese mismo sujeto. Por ejemplo, si el conjunto tiene 19 elementos,
Por lo que el primer cuartil será Q 1 = X 5.
Con parte decimal: supongamos que el elemento es un número con parte decimal entre el sujeto i y el i+1.
Sea un número de la forma i,d donde i es la parte entera y d la decimal. El cuartil será:
Q1 =xi+d ∙
xi+1 - xi
El cálculo del segundo cuartil depende de si el número de sujetos N es par o impar. Al ser la mediana, se utiliza el
procedimiento de cálculo de la mediana.