Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Medidas de tendencia central: media, mediana y moda, Apuntes de Estadística

Medidas de tendencia central media mediana moda

Tipo: Apuntes

2019/2020

Subido el 25/10/2020

alberto-vasquez-1
alberto-vasquez-1 🇨🇴

8 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Medidas de tendencia central:
media, mediana y moda
Una medida de tendencia central es una estadística de resumen que
representa el punto central o el valor típico de un conjunto de
datos. Estas medidas indican dónde caen la mayoría de los valores en
una distribución y también se conocen como la ubicación central de una
distribución. Puede pensar en ello como la tendencia de los datos a
agruparse en torno a un valor medio. En estadística , las tres medidas
más comunes de tendencia central son la media , la mediana y
la moda . Cada una de estas medidas calcula la ubicación del punto
central utilizando un método diferente.
La elección de la mejor medida de tendencia central depende del tipo de
datos que tenga. En esta publicación, exploro estas medidas de
tendencia central, le muestro cómo calcularlas y cómo determinar cuál
es la mejor para sus datos.
Ubicación del centro de sus datos
La mayoría de los artículos que leerá sobre la media, la mediana y la
moda se centran en cómo calcula cada uno. Voy a adoptar un enfoque
ligeramente diferente para empezar. Mi filosofía a lo largo de mi blog es
ayudarlo a comprender intuitivamente las estadísticas centrándose en
conceptos. En consecuencia, comenzaré por ilustrar el punto central de
varios conjuntos de datos gráficamente, para que comprenda el
objetivo. Luego, pasaremos a elegir la mejor medida de tendencia
central para sus datos y los cálculos.
Las tres distribuciones siguientes representan diferentes condiciones de
datos. En cada distribución, busque la región donde se encuentran los
valores más comunes. Aunque las formas y el tipo de datos son
diferentes, puede encontrar esa ubicación central. Esa es el área de la
distribución donde se encuentran los valores más comunes.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga Medidas de tendencia central: media, mediana y moda y más Apuntes en PDF de Estadística solo en Docsity!

Medidas de tendencia central:

media, mediana y moda

Una medida de tendencia central es una estadística de resumen que representa el punto central o el valor típico de un conjunto de datos. Estas medidas indican dónde caen la mayoría de los valores en una distribución y también se conocen como la ubicación central de una distribución. Puede pensar en ello como la tendencia de los datos a agruparse en torno a un valor medio. En estadística , las tres medidas más comunes de tendencia central son la media , la mediana y la moda. Cada una de estas medidas calcula la ubicación del punto central utilizando un método diferente. La elección de la mejor medida de tendencia central depende del tipo de datos que tenga. En esta publicación, exploro estas medidas de tendencia central, le muestro cómo calcularlas y cómo determinar cuál es la mejor para sus datos.

Ubicación del centro de sus datos

La mayoría de los artículos que leerá sobre la media, la mediana y la moda se centran en cómo calcula cada uno. Voy a adoptar un enfoque ligeramente diferente para empezar. Mi filosofía a lo largo de mi blog es ayudarlo a comprender intuitivamente las estadísticas centrándose en conceptos. En consecuencia, comenzaré por ilustrar el punto central de varios conjuntos de datos gráficamente, para que comprenda el objetivo. Luego, pasaremos a elegir la mejor medida de tendencia central para sus datos y los cálculos. Las tres distribuciones siguientes representan diferentes condiciones de datos. En cada distribución, busque la región donde se encuentran los valores más comunes. Aunque las formas y el tipo de datos son diferentes, puede encontrar esa ubicación central. Esa es el área de la distribución donde se encuentran los valores más comunes.

Publicación relacionada : Medidas de variabilidad: rango, rango intercuartílico, varianza y desviación estándar

Media

La media es el promedio aritmético y probablemente sea la medida de tendencia central que le resulte más familiar. Calcular la media es muy sencillo. Simplemente sume todos los valores y divida por el número de observaciones en su conjunto de datos. El cálculo de la media incorpora todos los valores en los datos. Si cambia cualquier valor, la media cambia. Sin embargo, la media no siempre ubica con precisión el centro de los datos. Observe los histogramas a continuación donde muestro la media en las distribuciones.

En una distribución simétrica, la media ubica el centro con precisión.

Cuando hay un número par de valores, cuenta los dos valores más internos y luego toma el promedio. El promedio de 27 y 29 es 28. En consecuencia, 28 es la mediana de este conjunto de datos. Los valores atípicos y los datos asimétricos tienen un efecto menor en la mediana. Para entender por qué, imagina que tenemos el conjunto de datos de la mediana a continuación y encontramos que la mediana es

  1. Sin embargo, descubrimos errores de entrada de datos y

necesitamos cambiar cuatro valores, que están sombreados en el conjunto de datos de la mediana fija. Los haremos todos significativamente más altos para que ahora tengamos una distribución sesgada con grandes valores atípicos. Como puede ver, la mediana no cambia en absoluto. Sigue siendo 46. A diferencia de la media, el valor de la mediana no depende de todos los valores del conjunto de datos. En consecuencia, cuando algunos de los valores son más extremos, el efecto sobre la mediana es menor. Por supuesto, con otros tipos de cambios, la mediana puede cambiar. Cuando tiene una distribución sesgada, la mediana es una mejor medida de tendencia central que la media. Comparando la media y la mediana Ahora, probemos la mediana en las distribuciones simétricas y sesgadas para ver cómo funciona, e incluiré la media en los histogramas para que podamos hacer comparaciones.

En una distribución sesgada, los valores atípicos de la cola alejan la media del centro hacia la cola más larga. Para este ejemplo, la media y la mediana difieren en más de 9000, y la mediana representa mejor la tendencia central de la distribución. Estos datos se basan en el ingreso de los hogares de EE. UU. Para 2006. El ingreso es el ejemplo clásico de cuándo usar la mediana porque tiende a estar sesgada. La mediana indica que la mitad de todos los ingresos están por debajo de 27581 y la mitad por encima. Para estos datos, la media sobreestima dónde cae la mayoría de los ingresos familiares. Cuándo usar la mediana : distribución sesgada , datos continuos, datos ordinales

Modo

La moda es el valor que ocurre con mayor frecuencia en su conjunto de datos. En un gráfico de barras, la moda es la barra más alta. Si los datos tienen varios valores que están vinculados por ocurrir con mayor frecuencia, tiene una distribución multimodal. Si no se repite ningún valor, los datos no tienen modo. En el siguiente conjunto de datos, el valor 5 ocurre con mayor frecuencia, lo que lo convierte en la moda. Estos datos pueden representar una escala Likert de 5 puntos. Normalmente, utiliza el modo con datos categóricos, ordinales y discretos. De hecho, la moda es la única medida de tendencia central que puede utilizar con datos categóricos , como el sabor preferido de

helado. Sin embargo, con datos categóricos, no hay un valor central porque no puede ordenar los grupos. Con datos ordinales y discretos, la moda puede ser un valor que no está en el centro. Nuevamente, la moda representa el valor más común. En el gráfico de calidad de servicio, Muy satisfecho es la moda de esta distribución porque es el valor más común en los datos. Observe cómo está en el extremo de la distribución. Estoy seguro de que los proveedores de servicios están satisfechos con estos resultados. Encontrar el modo para datos continuos En los datos continuos a continuación, no se repiten valores, lo que significa que no hay modo. Con datos continuos, es poco probable que dos o más valores sean exactamente iguales porque hay un número infinito de valores entre dos valores cualesquiera.

Cuándo usar el modo : datos categóricos , datos ordinales, datos de recuento, distribuciones de probabilidad

¿Cuál es mejor : la media, la mediana o la moda?

Cuando tiene una distribución simétrica para datos continuos, la media, la mediana y la moda son iguales. En este caso, los analistas tienden a usar la media porque incluye todos los datos en los cálculos. Sin embargo, si tiene una distribución sesgada, la mediana suele ser la mejor medida de tendencia central. Cuando tiene datos ordinales , la mediana o la moda suele ser la mejor opción. Para datos categóricos, debe usar el modo. En los casos en los que está decidiendo entre la media y la mediana como la mejor medida de tendencia central, también está determinando qué tipos de pruebas de hipótesis estadísticas son apropiadas para sus datos, si ese es su objetivo final. He escrito un artículo que analiza cuándo usar pruebas de hipótesis paramétricas (media) y no paramétricas (mediana) junto con las ventajas y desventajas de cada tipo.

Si está aprendiendo sobre estadística y le gusta el enfoque que utilizo en mi blog, consulte mi libro electrónico Introducción a la estadística.