








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Medidas de tendencia central media mediana moda
Tipo: Apuntes
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Una medida de tendencia central es una estadística de resumen que representa el punto central o el valor típico de un conjunto de datos. Estas medidas indican dónde caen la mayoría de los valores en una distribución y también se conocen como la ubicación central de una distribución. Puede pensar en ello como la tendencia de los datos a agruparse en torno a un valor medio. En estadística , las tres medidas más comunes de tendencia central son la media , la mediana y la moda. Cada una de estas medidas calcula la ubicación del punto central utilizando un método diferente. La elección de la mejor medida de tendencia central depende del tipo de datos que tenga. En esta publicación, exploro estas medidas de tendencia central, le muestro cómo calcularlas y cómo determinar cuál es la mejor para sus datos.
La mayoría de los artículos que leerá sobre la media, la mediana y la moda se centran en cómo calcula cada uno. Voy a adoptar un enfoque ligeramente diferente para empezar. Mi filosofía a lo largo de mi blog es ayudarlo a comprender intuitivamente las estadísticas centrándose en conceptos. En consecuencia, comenzaré por ilustrar el punto central de varios conjuntos de datos gráficamente, para que comprenda el objetivo. Luego, pasaremos a elegir la mejor medida de tendencia central para sus datos y los cálculos. Las tres distribuciones siguientes representan diferentes condiciones de datos. En cada distribución, busque la región donde se encuentran los valores más comunes. Aunque las formas y el tipo de datos son diferentes, puede encontrar esa ubicación central. Esa es el área de la distribución donde se encuentran los valores más comunes.
Publicación relacionada : Medidas de variabilidad: rango, rango intercuartílico, varianza y desviación estándar
La media es el promedio aritmético y probablemente sea la medida de tendencia central que le resulte más familiar. Calcular la media es muy sencillo. Simplemente sume todos los valores y divida por el número de observaciones en su conjunto de datos. El cálculo de la media incorpora todos los valores en los datos. Si cambia cualquier valor, la media cambia. Sin embargo, la media no siempre ubica con precisión el centro de los datos. Observe los histogramas a continuación donde muestro la media en las distribuciones.
En una distribución simétrica, la media ubica el centro con precisión.
Cuando hay un número par de valores, cuenta los dos valores más internos y luego toma el promedio. El promedio de 27 y 29 es 28. En consecuencia, 28 es la mediana de este conjunto de datos. Los valores atípicos y los datos asimétricos tienen un efecto menor en la mediana. Para entender por qué, imagina que tenemos el conjunto de datos de la mediana a continuación y encontramos que la mediana es
necesitamos cambiar cuatro valores, que están sombreados en el conjunto de datos de la mediana fija. Los haremos todos significativamente más altos para que ahora tengamos una distribución sesgada con grandes valores atípicos. Como puede ver, la mediana no cambia en absoluto. Sigue siendo 46. A diferencia de la media, el valor de la mediana no depende de todos los valores del conjunto de datos. En consecuencia, cuando algunos de los valores son más extremos, el efecto sobre la mediana es menor. Por supuesto, con otros tipos de cambios, la mediana puede cambiar. Cuando tiene una distribución sesgada, la mediana es una mejor medida de tendencia central que la media. Comparando la media y la mediana Ahora, probemos la mediana en las distribuciones simétricas y sesgadas para ver cómo funciona, e incluiré la media en los histogramas para que podamos hacer comparaciones.
En una distribución sesgada, los valores atípicos de la cola alejan la media del centro hacia la cola más larga. Para este ejemplo, la media y la mediana difieren en más de 9000, y la mediana representa mejor la tendencia central de la distribución. Estos datos se basan en el ingreso de los hogares de EE. UU. Para 2006. El ingreso es el ejemplo clásico de cuándo usar la mediana porque tiende a estar sesgada. La mediana indica que la mitad de todos los ingresos están por debajo de 27581 y la mitad por encima. Para estos datos, la media sobreestima dónde cae la mayoría de los ingresos familiares. Cuándo usar la mediana : distribución sesgada , datos continuos, datos ordinales
La moda es el valor que ocurre con mayor frecuencia en su conjunto de datos. En un gráfico de barras, la moda es la barra más alta. Si los datos tienen varios valores que están vinculados por ocurrir con mayor frecuencia, tiene una distribución multimodal. Si no se repite ningún valor, los datos no tienen modo. En el siguiente conjunto de datos, el valor 5 ocurre con mayor frecuencia, lo que lo convierte en la moda. Estos datos pueden representar una escala Likert de 5 puntos. Normalmente, utiliza el modo con datos categóricos, ordinales y discretos. De hecho, la moda es la única medida de tendencia central que puede utilizar con datos categóricos , como el sabor preferido de
helado. Sin embargo, con datos categóricos, no hay un valor central porque no puede ordenar los grupos. Con datos ordinales y discretos, la moda puede ser un valor que no está en el centro. Nuevamente, la moda representa el valor más común. En el gráfico de calidad de servicio, Muy satisfecho es la moda de esta distribución porque es el valor más común en los datos. Observe cómo está en el extremo de la distribución. Estoy seguro de que los proveedores de servicios están satisfechos con estos resultados. Encontrar el modo para datos continuos En los datos continuos a continuación, no se repiten valores, lo que significa que no hay modo. Con datos continuos, es poco probable que dos o más valores sean exactamente iguales porque hay un número infinito de valores entre dos valores cualesquiera.
Cuándo usar el modo : datos categóricos , datos ordinales, datos de recuento, distribuciones de probabilidad
Cuando tiene una distribución simétrica para datos continuos, la media, la mediana y la moda son iguales. En este caso, los analistas tienden a usar la media porque incluye todos los datos en los cálculos. Sin embargo, si tiene una distribución sesgada, la mediana suele ser la mejor medida de tendencia central. Cuando tiene datos ordinales , la mediana o la moda suele ser la mejor opción. Para datos categóricos, debe usar el modo. En los casos en los que está decidiendo entre la media y la mediana como la mejor medida de tendencia central, también está determinando qué tipos de pruebas de hipótesis estadísticas son apropiadas para sus datos, si ese es su objetivo final. He escrito un artículo que analiza cuándo usar pruebas de hipótesis paramétricas (media) y no paramétricas (mediana) junto con las ventajas y desventajas de cada tipo.
Si está aprendiendo sobre estadística y le gusta el enfoque que utilizo en mi blog, consulte mi libro electrónico Introducción a la estadística.