Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Análisis de Distribución de Frecuencias de Datos: Agrupados y No Agrupados, Diapositivas de Estadística

Conceptos básicos sobre la distribución de frecuencias de datos agrupados y no agrupados. Se incluyen ejemplos de tablas de frecuencias, tablas de contingencia y diagramas de barras y caja-bigotes. Se recomienda su estudio para universidad, especialmente en temas de estadística descriptiva.

Qué aprenderás

  • ¿Cómo se calcula la frecuencia absoluta y relativas de una variable?
  • ¿Qué es una tabla de contingencia y para qué sirve?
  • ¿Cómo se construye un histograma y qué significa su sesgo?
  • ¿Qué es un outlier y cómo se detecta en un conjunto de datos?
  • ¿Cómo se interpreta un diagrama de caja y bigotes?

Tipo: Diapositivas

2021/2022

Subido el 02/06/2022

fozter-fz
fozter-fz 🇨🇴

5 documentos

1 / 35

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
REPRESENTACIÓN DE UN
CONJUNTO DE DATOS
MSc. Ing. Juan Carlos Acosta Jiménez
Estadística Descriptiva
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23

Vista previa parcial del texto

¡Descarga Análisis de Distribución de Frecuencias de Datos: Agrupados y No Agrupados y más Diapositivas en PDF de Estadística solo en Docsity!

REPRESENTACIÓN DE UN

CONJUNTO DE DATOS

MSc. Ing. Juan Carlos Acosta Jiménez

Estadística Descriptiva

¿Cómo se organiza la información? El principal método para organizar datos, es el uso de Tablas de frecuencia , las cuales se pueden agrupar mediante intervalos (para las variables continuas) llamados clases, o de manera individual por categoría (variables cualitativas). Las Distribuciones de frecuencia , son tablas que permiten resumir los datos originales en frecuencias. Los tipos de frecuencias pueden ser:

  • Frecuencia Absoluta: Es el número de veces que se repite una misma clase. Suele notarse por 𝑓! y satisface la propiedad ∑! 𝑓! = 𝑁
  • Frecuencia Relativa: Muestra la ponderación o peso de la clase en el conjunto de datos. Se define como el cociente 𝑓"! = #! $ cumple la propiedad ∑! 𝑓"! = 1.
  • Frecuencia Absoluta acumulada: Indica la ponderación en frecuencia absoluta correspondiente a valores menores o iguales que un valor dado. Se denota por 𝐹! y se define 𝐹! = ∑%&! 𝑓%
  • Frecuencia Relativa acumulada: Indica la ponderación en frecuencia relativa correspondiente a valores menores o iguales que un valor dado. Se denota por 𝐹"! y se define 𝐹"! = ∑%&! 𝑓"% Distribuciones de frecuencia para datos no agrupados Representación de un conjunto de datos

Ejemplo de una tabla de frecuencias para datos agrupados Representación de un conjunto de datos 2 40 = 0 , 05 ”El 5% de las edades tienen valores entre 10 y 14 años ” 1 40 = 0 , 025 ”El 2,5% de las edades tienen valores entre 30 y 34 años ” ”Hay 3 edades que tienen valores entre 25 y 29 años ”

Tablas de frecuencias Bivariadas Se tabulan dos variables en una sola tabla, también reciben el nombre de Tablas de contingencia. Representación de un conjunto de datos Ejemplo de tabla de frecuencias bivariada Se usan en variables nominales, ordinales y numéricas discretas. ”Hay 22 hombres que son casados” ”Hay 8 personas de género femenino que su hobby es ver Tv” ¿Qué % del total de personas, le gustan los deportes? ¿Qué % del total de hombres, le gustan los deportes?

Ejemplo 1: Tabla para datos NO agrupados Se utilizan cuando la variable es cualitativa y cuando es cuantitativa con pocas categorías (clases). De esta tabla se puede concluir que:

  • Hay 2 estudiantes que tienen 16 años
  • El 4 % de los estudiantes tienen 18 años
  • Hay 11 estudiantes que tienen edades (menores o iguales a 17 ) entre 16 y 17 años
  • El 88 % de los estudiantes tienen edades (menores o iguales a 19 ) entre 16 y 19 años n Clase fi fri (%) Fi Fri (%) 1 16 2 0,08 2 0, 2 17 9 0,36 11 0, 3 18 1 0,04 12 0, 4 19 10 0,4 22 0, 5 20 3 0,12 25 1 Total 25 A 25 estudiantes de cierto programa, se les pregunta su edad (años). Representación de un conjunto de datos Ejercicio 1: Realice una tabla de frecuencias para los siguientes datos 18 19 18 18 19 20 20 18 19 17 21 18 17

Para construir una distribución de frecuencias para una variable continua, se debe tener en cuenta: 1) Determinación del rango: Se denota con 𝑅 y se calcula efectuando la diferencia entre el valor del dato máximo con el mínimo. Es decir, 𝑅𝑎𝑛𝑔𝑜 = 𝑅 = 𝑥 (^) '() − 𝑥 (^) '!* 2) Determinación del número de intervalos de clase: Se denota con 𝑘 y se recomienda que no sean menos de 5 ni más de 12 clases. Se obtiene a partir de las Regla de Sturges :

𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 𝑘 = 1 + 3 , 32 log+, 𝑁

3) Determinación de la amplitud de los intervalos: Se denota con ∆𝑥, se obtiene dividiendo el rango entre el número de clases. Esto es, A𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = ∆𝑥 =

  • (*./

!*12"3(4/

Distribuciones de frecuencias para datos agrupados Representación de un conjunto de datos

Ejemplo 2: Tabla para datos agrupados De esta tabla se puede concluir que:

  • Hay 33 mujeres que tienen edades entre 21 y 23 años
  • El 13 , 51 % de las mujeres tienen edades entre 27 y 30 años
  • Hay 178 mujeres que tienen edades (menores o iguales a 36 ) entre 14 y 36 años
  • El 91 , 35 % de las mujeres tienen edades (menores o iguales a 33 ) entre 14 y 33 años Basados en la variable EDAD (años) del archivo “Mujeres gestantes”, se tiene la siguiente tabla de frecuencias. Representación de un conjunto de datos i Limite inferior limite superior Frecuencia absoluta (fi) Frecuencia relativa (fri) Frecuencia absoluta acumulada (Fi) Frecuencia relativa acumulada (Fri) 1 14 17,2 24 0,1297 24 0, 2 17,2 20,4 48 0,2595 72 0, 3 20,4 23,7 33 0,1784 105 0, 4 23,7 26,9 30 0,1622 135 0, 5 26,9 30,1 25 0,1351 160 0, 6 30,1 33,3 9 0,0486 169 0, 7 33,3 36,6 9 0,0486 178 0, 8 36,6 39,8 5 0,0270 183 0, 9 39,8 43,0 2 0,0108 185 1 Total 185 1

Ejemplo 3: Tabla para datos agrupados Se utilizan cuando la variable es cuantitativa con muchas categorías (clases). De esta tabla se puede concluir que:

  • Hay 259 inmuebles que tienen una superficie entre 80 y 100 metros cuadrados
  • El 7 , 5 % de los inmuebles tienen superficies entre 160 y 180 metros cuadrados
  • Hay 2831 inmuebles que tienen superficies (menores o iguales a 260 ) entre 240 y 260 metros cuadrados
  • El 46 , 3 % de los inmuebles tienen superficies (menores o iguales a 160 ) entre 40 y 160 Basados en la variable Superficie (metros cuadrados) del archivo “Inmobiliaria”, se tiene la siguiente tabla de frecuencias. Intervalo n límite inf. lìmite sup fa fr Fa Fr 1 40 60 244 7,3% 244 7,3% 2 60 80 284 8,5% 528 15,8% 3 80 100 259 7,8% 787 23,6% 4 100 120 256 7,7% 1043 31,3% 5 120 140 263 7,9% 1306 39,1% 6 140 160 239 7,2% 1545 46,3% 7 160 180 250 7,5% 1795 53,8% 8 180 200 252 7,6% 2047 61,3% 9 200 220 245 7,3% 2292 68,7% 10 220 240 267 8,0% 2559 76,7% 11 240 260 272 8,2% 2831 84,8% 12 260 280 251 7,5% 3082 92,4% 13 280 300 255 7,6% 3337 100,0% total 3337 Representación de un conjunto de datos

Diagrama de barras (Bar chart) Se puede utilizar para variables categóricas y numéricas discretas, consisten en graficar las clases vs las frecuencias absolutas o relativas. En el eje horizontal se especifican los indicadores o nombres de cada clase y en el eje vertical una escala de frecuencia. Representación de un conjunto de datos La barras también pueden ser de forma horizontal y combinarse varias categorías.

Ejemplo 4 : En el año anterior, se realizó un estudio a un grupo de mujeres de una clínica de maternidad. (Utilice los datos de la hoja de Excel “mujeres gestantes en Cartagena”) a) Realice un gráfico de barras para la variable “OCUPACIÓN”. b) Construya una tabla de contingencia para las variables “ESTADO CIVIL” y “ESTRATO” Representación de un conjunto de datos 130 8 10 23 14 AMA DE CASA DESEMPLEADA TRABAJO INDEPENDIENTE ESTUDIANTE EMPLEADA Diagrama de barras (ocupación) ESTADO CIVIL ESTRATO Total 1 2 3 CASADA 14 11 3 28 SEPARADA 2 2 SOLTERA 12 5 17 UNION LIBRE 94 41 3 138 Total 122 57 6 185

De acuerdo a los datos anteriores, realice un gráfico adecuado que

consolide dicha información.

Solución. Puesto que la variable de interés es cualitativa, entonces hacemos el siguiente diagrama circular. Hotel Frecuencia % Grados Capilla de Mar 4 8% 29 Caribe 6 12% 44 Charleston 5 10% 37 De camerón 12 24% 88 Hilton 6 12% 44 Las Américas 8 16% 59 Santa Clara 8 16% 59 8% 12% 10% 25% 12% 17% 16% Preferencias de los Turistas Capilla de Mar Caribe Charleston De camerón Hilton Las Américas Santa Clara Representación de un conjunto de datos

Pictogramas (Pictogram) ¿Cuántas ponquecitos se vendieron el día jueves? Es un diagrama que utiliza imágenes o símbolos para mostrar datos para una rápida comprensión. Representación de un conjunto de datos

Representación de un conjunto de datos^19 𝑨 = −𝟎. 𝟖𝟏 1 0 5 30 25 39 [4,0, 8,2] (8,2, 12,3] (12,3, 16,5] (16,5, 20,7] (20,7, 24,8] (24,8, 29,0] Histograma (Sesgo negativo)

Representación de un conjunto de datos^20 𝑨 = −𝟎. 𝟎𝟎𝟐 ≈ 𝟎 15 20 26 21 18 [1, 3] (3, 5] (5, 6] (6, 8] (8, 10] Histograma (Insesgado)