Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Caracterización de un conjunto de datos, Diapositivas de Estadística

Un conjunto de datos tiene varias caracteristicas que definen su estructura y propiedades.

Tipo: Diapositivas

2021/2022

Subido el 02/06/2022

fozter-fz
fozter-fz 🇨🇴

5 documentos

1 / 26

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
CARACTERIZACIÓN DE UN
CONJUNTO DE DATOS
MSc. Ing. Juan Carlos Acosta Jiménez
Estadística Descriptiva
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Vista previa parcial del texto

¡Descarga Caracterización de un conjunto de datos y más Diapositivas en PDF de Estadística solo en Docsity!

CARACTERIZACIÓN DE UN

CONJUNTO DE DATOS

MSc. Ing. Juan Carlos Acosta Jiménez Estadística Descriptiva

4

  • Mediana 𝑴𝒆 : es el valor central de los datos, es decir, el que

divide en dos partes iguales nuestras observaciones luego de ser

ordenadas de menor a mayor. No resulta afectada por valores

extremos.

Si 𝑛 es impar, entonces 𝑀" = 𝑥 !"#

$

Si 𝑛 es par, entonces 𝑀" =

#! $ $#! $"# %

  • Moda 𝑴𝒐 : Es el dato u observación de más alta frecuencia

Caracterización de un conjunto de datos

5

  • Ejemplo 1 : Un ascensor tiene capacidad para soportar un peso

máximo de 700 kilos. Al ser utilizado por 6 niños que pesan en

promedio 20 kilos y 8 adultos que pesan en promedio 72 kilos. ¿Está

sobrecargado el ascensor?, explique.

Medidas de tendencia central

Solución: 𝑥% = 𝑝𝑒𝑠𝑜 𝑑𝑒 𝑒𝑙 𝑛𝑖ñ𝑜 𝑖 𝑦% = 𝑝𝑒𝑠𝑜 𝑑𝑒 𝑒𝑙 𝑎𝑑𝑢𝑙𝑡𝑜 𝑖 Por definición, tenemos:

𝑥̅&%ñ() =

∑%^ ,*^ +𝑥% 6 =^

𝑥+ + 𝑥- + 𝑥. + 𝑥/ + 𝑥 0 + 𝑥, 6 =^20

𝑦 (^6) 12345() =

∑%^6 *^ +𝑦% 8 =^

𝑦+ + 𝑦- + 𝑦. + 𝑦/ + 𝑦 0 + 𝑦, + 𝑦 7 + 𝑦 6 8 =^72

El ascensor está sobrecargado si el peso total supera los 700 kilos, en este caso tenemos: 𝑃𝑒𝑠𝑜 𝑡𝑜𝑡𝑎𝑙 = : %*+

, 𝑥% + : %*+

6 𝑦% = 6 20 + 8 72 = 120 + 576 = 696

Por tanto, el ascensor NO está sobrecargado.

7 Luego, 𝑥+ + 𝑥- + 𝑥. + ⋯ + 𝑥 66 + 𝑥 69 + 𝑥 98 + 𝑥-- 220 =^ $^1.^200.^000 88 𝑥̅+ + 132 𝑥̅- 220 =^ $^1.^200.^000 88 𝑥̅+ + 132 𝑥̅- = 220 ($ 1. 200. 000 ) 88 𝑥̅+ + 132 (𝑥̅+ − $ 180. 000 ) = 220 ($ 1. 200. 000 ) 88 𝑥̅+ + 132 𝑥̅+ − $ 23. 760. 000 = $ 264. 000. 000 220 𝑥̅+ − $ 23. 760. 000 = $ 264. 000. 000 220 𝑥̅+ = $ 287. 760. 000

𝑥̅+ = $^287220.^760.^000

𝑥̅+ = $ 1. 308. 000

  • Ejercicio: Un grupo de 200 estudiantes, cuya estatura media es de 160 , 96 centímetros se divide en dos grupos, uno con una estatura media de 163 , 4 centímetros y otro con una de 157 , 3 centímetros. ¿Cuántos estudiantes hay en cada grupo?

Medidas de variabilidad o dispersión

  • Rango: También denominado recorrido, es la diferencia entre el

máximo y el mínimo valor de las observaciones. 𝑅 = 𝑥&'# − 𝑥&()

8

El rango ignora el modo en el se distribuyen los datos

El rango es sensible

a outliers.

Caracterización de un conjunto de datos

10

𝑠! = ∑"#$

% (^) 𝑥"− 𝑥̅! & 𝑛 − 1

= 11 −^15.^5 &^ +^12 −^15.^5 &^ +^13 −^15.^5 &^ +^16 −^15.^5 8 &^ +−^116 −^15.^5 &^ +^17 −^15.^5 &^ +^18 −^15.^5 &^ +^21 −^15.^5 &

= −^4.^5 &^ +^ −^3.^5 &^ +^ −^2.^5 &^ +^0.^5 7 &^ +^0.^5 &^ +^1.^5 &^ +^2.^5 &^ +^5.^5 &

= 20.^25 +^12.^25 +^6.^25 +^0.^25 7 +^0.^25 +^2.^25 +^6.^25 +^30.^25

= (^787) = 11. 1428571 = 3. 33809184 = 3. 338

𝑥̅! = ∑"#$

% (^) 𝑥" 𝑛 =^

11 + 12 + 13 + 16 + 16 + 17 + 18 + 21 8 =^

124 8 =^15.^5

Caracterización de un conjunto de datos^11

  • Coeficiente de variación: Se utiliza para comparar la variabilidad de conjuntos de datos que se miden sobre objetos o momentos temporales diferentes. 𝑐𝑣 =

𝑥̅ ∗^100

Ejemplo 1 : En un área de servicios dentro de una empresa de manufactura se realiza una encuesta para evaluar la calidad del servicio proporcionado y el nivel de satisfacción de los clientes internos. La encuesta consiste de 10 preguntas, y cada una de ellas evalúa diferentes aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos se suman los puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los puntos obtenidos en 50 cuestionarios.

Caracterización de un conjunto de datos^13

78 78 82 85 81 86 80 73 84 78 68 84 75 78 76 76 82 85 91 80 70 87 77 82 84 48 49 39 39 43 35 42 34 44 49 34 30 43 31 34 41 42 45 42 35 38 39 42 43 29 Calcule las medidas de tendencia central y de dispersión a los datos anteriores y de una primera opinión acerca de la calidad en el servicio.

Caracterización de un conjunto de datos^14

Ejemplo 2: Al analizar una muestra obtenida de un grupo de 12 trabajadores de cierta empresa se obtuvieron los siguientes resultados: Peso (kilogramos)

Estatura (metros)

Edad (años) 65 1,69 23 63 1,75 22 75 1,64 23 72 1,53 25 68 1,7 24 66 1,64 23 65 1,64 24 68 1,64 24 63 1,54 23 66 1,72 24 75 1,94 23 75 1,59 22

a) Determine las medidas de dispersión b) ¿Cuál variable presenta mayor variabilidad? Explique.

Caracterización de un conjunto de datos^16

  • Ejercicio: El gerente de operaciones de un servicio de paquetería desea adquirir una nueva flota de autos. Cuando los paquetes se guardan con eficiencia en el interior de los autos durante la preparación de las entregas, se deben considerar dos restricciones principales: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. Ahora, en una muestra de 200 paquetes, el peso promedio es 26 libras con una desviación estándar de 3 , 9 libras. Además, el volumen promedio de cada paquete es 8 , 8 pies cúbicos con una desviación estándar de 2 , 2 pies cúbicos. ¿Cuál variable es más consistente?

Ejemplo 3: De acuerdo con la información de la distribución de los costos e ingresos de una cierta empresa en el transcurso de este año, responda: Meses Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Costos (millones) Ingresos 0,91^ 0,85^ 0,77^ 0,84^ 0,97^ 0,9^ 1,7^ 1,1^ 0, (millones) 1,4^ 1,27^ 1,08^ 1,3^ 1,42^ 1,32^ 1,72^ 1,05^ 1, 1 ) ¿Qué variable ha tenido menor dispersión en el transcurso del año? a) Mes b) Costo c) Ingresos d) Utilidad 2 ) ¿Qué variable ha tenido menor consistencia en el transcurso del año? a) Mes b) Costo c) Ingresos d) Utilidad

Recuerde definir utilidad = Ingresos - Costos

Medidas de posición relativa o colocación

Caracterización de un conjunto de datos^17

  • Cuantiles: son valores que dividen en partes iguales una determinada cantidad de datos. Los mas importantes cuantiles resultan ser: percentiles 𝑃 7 , deciles 𝐷 7 y los cuartiles 𝑄 7.
  • Percentiles: toman valores del 1 al 99 , el 𝑖% de la muestra son valores menores que él y el 100 − 𝑖% restante son mayores.

Por ejemplo: 𝑃 89 representa el 40 - ésimo percentil y es el valor debajo del cual se encuentran el 40 % por ciento de las observaciones o también se podría escribir que indica el valor encima del cual se encuentran el 60 % por ciento de las observaciones.

Caracterización de un conjunto de datos^19

Otro ejemplo: 𝑃:; representa el 75 - ésimo percentil y es el valor debajo del cual se encuentran el 75 % por ciento de las observaciones o también se podría escribir que indica el valor encima del cual se encuentran el 25 % por ciento de las observaciones.

  • Deciles: existen nueve deciles 𝐷#,𝐷%,𝐷&, 𝐷 8 , 𝐷;, 𝐷<, 𝐷:, 𝐷=, 𝐷> que dividen a un conjunto de datos numéricos en 10 partes iguales.
  • Cuartiles : Existen tres cuartiles 𝑄#, 𝑄% y 𝑄& que dividen a un conjunto de datos numéricos en 4 partes iguales.

Caracterización de un conjunto de datos^20

  1. Los datos 𝑥#, 𝑥%, … , 𝑥$ se deben ordenar de menor a mayor.
  2. Buscamos el valor del índice 𝑖, el cual está dado por 𝒊 = 𝒑^ 𝟏𝟎𝟎𝒏#𝟏 + 𝟏 = 𝒌. 𝒅 = 𝒌 + 𝟎. 𝒅 Donde, 𝑝 es el percentil buscado 𝑛 es el número de datos 𝑘 es el valor entero del índice 𝑑 es el valor decimal del índice

¿Cómo se determinan los percentiles?

  1. El P − 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 está dado por el valor de la expresión

𝒙 (^) 𝒌 + 𝒅 𝒙 (^) 𝒌'𝟏 − 𝒙 (^) 𝒌

donde 𝑥 7 es el valor del dato que está en la posición 𝑘.