









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Una investigación documental sobre estadística descriptiva, centrándose en datos no agrupados. Explora conceptos clave como medidas de tendencia central (media, mediana, moda), medidas de dispersión (rango, varianza, desviación estándar, coeficiente de variación) y medidas de posición (cuartiles, deciles, percentiles). El documento proporciona ejemplos y fórmulas para comprender estos conceptos y aplicarlos en análisis estadísticos.
Tipo: Transcripciones
1 / 17
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
La estadística descriptiva es una herramienta fundamental para organizar, resumir y
presentar datos de manera informativa. Nos permite transformar grandes conjuntos de información
en medidas fáciles de entender, como promedios, medianas y desviaciones estándar. A través de
este texto, exploraremos cómo estas medidas nos ayudan a comprender mejor los datos y a tomar
decisiones más informadas.
La Estadística Descriptiva también desarrolla técnicas que estudian la dependencia que puede existir entre dos o más características observadas en una serie de individuos. Son las denominadas técnicas de regresión y correlación.
Estadística descriptiva-. Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no agrupados y luego para datos agrupados. Medidas estadísticas en datos no agrupados.
Promedio o media: La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc. Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:
Mediana: Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda: La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación. Rango de variación Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
Rango de variación: Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
Las medidas de posición son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.
Cuantiles Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. % de los datos. Se dividen por 4 Como se calculan? dividen el conjunto en cuatro partes iguales. Por ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25.
Deciles En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un grupo de datos ordenados en diez partes iguales, de manera que cada parte representa1/10 de la muestra o población. Como se calculan? Son aquellas variables que dividen a una distribución en 10 partes iguales, por lo tanto hay 9 deciles. El decil 5 (D5) coincide con la mediana y con el segundo cuartil, es decir D5= Me=Q2 El cálculo de los Deciles es similar al de los Cuartiles y Percentiles.
Percentiles El percentil es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo. ¿Cómo se resuelve? El percentil es una medida de posición no central. Por ejemplo, si el conjunto tiene 199 elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P 50 =X 100.
Se identifica como datos agrupados a los datos dispuestos en una distribución de frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza y desviación estándar deben incluir una leve modificación. A continuación se entregan los detalles para cada una de las medidas.
Promedio en datos agrupados La fórmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores de Yi. Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un programa de lactancia materna, clasificadas según el número de partos. Por tratarse de una variable en escala discreta, las clases o categorías asumen sólo ciertos valores: 1, 2, 3, 4, 5.
Mediana en datos agrupados: Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la frecuencia acumulada que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya que 42/2 es igual a 21 y la frecuencia acumulada que supera inmediatamente a 21 es 33, que corresponde a un valor de variable (Yi) igual a 3. Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2, partos por madre,
Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos. Retomemos el ejemplo de la variable número de partos:
El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera inmediatamente al “j” % de los casos (jxn/100). El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea inmediatamente superior a 33,6 ((80x42) /100). El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4. Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un 80% de las madres estudiadas han tenido 4 partos o menos. Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente más complejo ya que se hace necesaria la aplicación de una fórmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente superior al “j” % de los casos (jxn/100). En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en miles de pesos. Nótese que para calcular el centro de clase se usaron los límites reales de cada intervalo.
Promedio o media: La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.
Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:
Estos cálculos se pueden simbolizar:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:
Consideremos a modo de ejemplo una muestra de 4 observaciones
Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de dispersión: s2 = 34 / 3 = 11,33 Varianza de la muestra
La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.
Interpretación de la varianza (válida también para la desviación estándar): un alto valor de la varianza indica que los datos están alejados del promedio. Es difícil hacer una interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos están más cerca del promedio y en cambio en la muestra b los datos están más alejados del promedio.
Coeficiente de variación: Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar de la muestra expresada como porcentaje de la media muestral. Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es independiente de la unidad de medida de la variable de estudio.
En resumen, la estadística descriptiva es una herramienta esencial para dar sentido a los
datos que nos rodean. Al calcular medidas como la media, la mediana y la desviación estándar,
podemos obtener una visión clara y concisa de un conjunto de datos. Estas medidas nos permiten
identificar tendencias, comparar grupos y tomar decisiones basadas en evidencia. A través de este
análisis, podemos descubrir patrones ocultos en los datos y obtener una comprensión más profunda
de los fenómenos que estudiamos.
Medwave. Año XI, No. 3, Marzo 2011. Open Access, Creative Commons.
Douglas A. Lind, William G. Marchal y Robert D. Mason, Statistical Techiques in Business and Economics, Estadística para Administración y Economía, Alfaomega 11 ed.
Santiago Fernández, Alejando Córdoba, José Ma. Cordero, Estadística Descriptiva, ESIC Editorial, Madrid 2002
https://www.geogebra.org/m/f4byn8tk