Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Estadística Descriptiva: Datos No Agrupados - Investigación Documental, Transcripciones de Probabilidad

Una investigación documental sobre estadística descriptiva, centrándose en datos no agrupados. Explora conceptos clave como medidas de tendencia central (media, mediana, moda), medidas de dispersión (rango, varianza, desviación estándar, coeficiente de variación) y medidas de posición (cuartiles, deciles, percentiles). El documento proporciona ejemplos y fórmulas para comprender estos conceptos y aplicarlos en análisis estadísticos.

Tipo: Transcripciones

2023/2024

Subido el 22/02/2025

andrade-castro-emmanuel
andrade-castro-emmanuel 🇲🇽

1 documento

1 / 17

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
INSTITUTO TECNOLÓGICO SUPERIOR DE ACAYUCAN
INGENIERÍA INDUSTRIAL
MATERIA: PROBABILIDAD Y ESTADÍSTICA
CLAVE DE LA ASIGNATURA: AEC-1053
TEMA: ESTADÍSTICA DESCRIPTIVA 1.1.1 DATOS NO AGRUPADOS
ACTIVIVIDAD: 1
NOMBRE DEL TRABAJO: INVESTIGACIÓN DOCUMENTAL RELACIONADO
CON EL TEMA DE ESTADÍSTICA DESCRIPTIVA
DOCENTE: JULIO CESAR ORTIZ ANTONIO
ALUMNO: EMMANUEL ANDRADE CASTRO
MATRÍCULA: 240B0171
GRUPO: 204-A
ACAYUCAN, VER. 28/ENERO/2025
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Estadística Descriptiva: Datos No Agrupados - Investigación Documental y más Transcripciones en PDF de Probabilidad solo en Docsity!

INSTITUTO TECNOLÓGICO SUPERIOR DE ACAYUCAN

INGENIERÍA INDUSTRIAL

MATERIA: PROBABILIDAD Y ESTADÍSTICA

CLAVE DE LA ASIGNATURA: AEC-

TEMA: ESTADÍSTICA DESCRIPTIVA – 1.1.1 DATOS NO AGRUPADOS

ACTIVIVIDAD: 1

NOMBRE DEL TRABAJO: INVESTIGACIÓN DOCUMENTAL RELACIONADO

CON EL TEMA DE ESTADÍSTICA DESCRIPTIVA

DOCENTE: JULIO CESAR ORTIZ ANTONIO

ALUMNO: EMMANUEL ANDRADE CASTRO

MATRÍCULA: 240B

GRUPO: 204-A

ACAYUCAN, VER. 28/ENERO/

INTRODUCCIÓN

La estadística descriptiva es una herramienta fundamental para organizar, resumir y

presentar datos de manera informativa. Nos permite transformar grandes conjuntos de información

en medidas fáciles de entender, como promedios, medianas y desviaciones estándar. A través de

este texto, exploraremos cómo estas medidas nos ayudan a comprender mejor los datos y a tomar

decisiones más informadas.

La Estadística Descriptiva también desarrolla técnicas que estudian la dependencia que puede existir entre dos o más características observadas en una serie de individuos. Son las denominadas técnicas de regresión y correlación.

Estadística descriptiva-. Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.

Medidas de tendencia central.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no agrupados y luego para datos agrupados. Medidas estadísticas en datos no agrupados.

 Promedio o media: La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc. Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:

 Mediana: Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

 Moda: La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.

Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación. Rango de variación Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.

 Rango de variación: Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.

Medidas de posición

Las medidas de posición son valores que permiten dividir el conjunto de datos en partes porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.

Cuantiles Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. % de los datos. Se dividen por 4 Como se calculan? dividen el conjunto en cuatro partes iguales. Por ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25.

Deciles En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un grupo de datos ordenados en diez partes iguales, de manera que cada parte representa1/10 de la muestra o población. Como se calculan? Son aquellas variables que dividen a una distribución en 10 partes iguales, por lo tanto hay 9 deciles. El decil 5 (D5) coincide con la mediana y con el segundo cuartil, es decir D5= Me=Q2 El cálculo de los Deciles es similar al de los Cuartiles y Percentiles.

Percentiles El percentil es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo. ¿Cómo se resuelve? El percentil es una medida de posición no central. Por ejemplo, si el conjunto tiene 199 elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P 50 =X 100.

Medidas de tendencia central y de dispersión en datos agrupados

Se identifica como datos agrupados a los datos dispuestos en una distribución de frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza y desviación estándar deben incluir una leve modificación. A continuación se entregan los detalles para cada una de las medidas.

 Promedio en datos agrupados La fórmula es la siguiente:

Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores de Yi. Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un programa de lactancia materna, clasificadas según el número de partos. Por tratarse de una variable en escala discreta, las clases o categorías asumen sólo ciertos valores: 1, 2, 3, 4, 5.

 Mediana en datos agrupados: Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la frecuencia acumulada que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya que 42/2 es igual a 21 y la frecuencia acumulada que supera inmediatamente a 21 es 33, que corresponde a un valor de variable (Yi) igual a 3. Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:

Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2, partos por madre,

Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos. Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera inmediatamente al “j” % de los casos (jxn/100). El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea inmediatamente superior a 33,6 ((80x42) /100). El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4. Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un 80% de las madres estudiadas han tenido 4 partos o menos. Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente más complejo ya que se hace necesaria la aplicación de una fórmula.

Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente superior al “j” % de los casos (jxn/100). En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en miles de pesos. Nótese que para calcular el centro de clase se usaron los límites reales de cada intervalo.

Medidas de tendencia central en datos no agrupados

 Promedio o media: La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:

Consideremos a modo de ejemplo una muestra de 4 observaciones

Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de dispersión: s2 = 34 / 3 = 11,33 Varianza de la muestra

La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.

Interpretación de la varianza (válida también para la desviación estándar): un alto valor de la varianza indica que los datos están alejados del promedio. Es difícil hacer una interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos están más cerca del promedio y en cambio en la muestra b los datos están más alejados del promedio.

 Coeficiente de variación: Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar de la muestra expresada como porcentaje de la media muestral.  Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es independiente de la unidad de medida de la variable de estudio.

Ejemplos de la aplicación de la estadística en la Ingeniería:

  1. Ingeniería industrial Se utiliza para medir la producción, estudiar el mercado, y analizar la seguridad industrial.
  2. Ingeniería ambiental Se utiliza para modelar el impacto de las actividades humanas en el medio ambiente.
  3. Diseño de productos Se utiliza para diseñar nuevos productos y mejorar su calidad.

Glosario

  1. Estadística-. se refiere a información numérica.
  2. Estadística descriptiva-. Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.
  3. Medidas de tendencia central.-. Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
  4. Media-. El promedio se refiere a la media de los datos. Puedes calcular la media sumando el total de los datos y dividiéndolo por el número de puntos de datos.
  5. Variable dependiente-. Una variable dependiente es un valor que depende de otra variable para mostrar un cambio. Cuando se computa en el análisis estadístico, se pueden utilizar las variables dependientes para sacar conclusiones sobre las causas de los acontecimientos, los cambios y otras traducciones en la investigación estadística.
  6. Variable independiente-. Una variable independiente es un valor que no depende de otro factor para mostrar cambios. Las variables independientes son necesarias para llevar a cabo investigaciones que se centran en las relaciones causales. Además, las variables independientes son necesarias en las pruebas de regresión, donde los analistas pueden medir las correlaciones entre una o más variables independientes y las variables dependientes.
  7. Estadística inferencial-. La estadística inferencial es una prueba que se utiliza para comparar un determinado conjunto de datos dentro de una población de diversas maneras. La estadística inferencial incluye pruebas paramétricas y no paramétricas. Cuando se realiza una prueba estadística inferencial, se toman datos de una población pequeña y se hacen inferencias sobre si proporcionará resultados similares en una población más grande.
  8. Parámetro-. Un parámetro es una medida cuantitativa que se utiliza para medir la población. Es el valor desconocido de una población sobre el que se investiga para saber más.
  9. Población-. La población se refiere al grupo que está estudiando. Esto podría incluir un determinado grupo demográfico o una muestra del grupo, que es un subconjunto de la población.
  10. Rango.- El rango es la diferencia entre los valores más bajos y más altos de una colección de datos. Proporciona una guía para saber dónde se pueden asignar los números en una curva de campana.
  11. Análisis de regresión-. El análisis de regresión se refiere al proceso estadístico de estimar una relación entre dos variables aleatorias diferentes. Se puede utilizar el análisis de regresión para predecir la correlación entre una variable dependiente y una serie de variables independientes. El análisis de regresión también puede ser una regresión lineal o un análisis de regresión múltiple, en el que el número de variables a evaluar puede cambiar.

CONCLUSIÓN

En resumen, la estadística descriptiva es una herramienta esencial para dar sentido a los

datos que nos rodean. Al calcular medidas como la media, la mediana y la desviación estándar,

podemos obtener una visión clara y concisa de un conjunto de datos. Estas medidas nos permiten

identificar tendencias, comparar grupos y tomar decisiones basadas en evidencia. A través de este

análisis, podemos descubrir patrones ocultos en los datos y obtener una comprensión más profunda

de los fenómenos que estudiamos.

REFERENCIAS

Medwave. Año XI, No. 3, Marzo 2011. Open Access, Creative Commons.

Douglas A. Lind, William G. Marchal y Robert D. Mason, Statistical Techiques in Business and Economics, Estadística para Administración y Economía, Alfaomega 11 ed.

Santiago Fernández, Alejando Córdoba, José Ma. Cordero, Estadística Descriptiva, ESIC Editorial, Madrid 2002

https://www.geogebra.org/m/f4byn8tk