Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Informacion para TP3 Est 2 S21, Ejercicios de Estadística

Contenido para realizar el trabajo practico numero 3

Tipo: Ejercicios

2024/2025

Subido el 01/07/2025

luis-capello
luis-capello 🇦🇷

1 documento

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADÍSTICA 2
Documentación y Trabajo practico:
Documentación correspondiente:
Prueba de variables categóricas.
Prueba de bondad de ajuste.
→ Sirve para determinar si una población tiene una distribución teórica específica, ya sea una
distribución
conocida o una distribución ad hoc.
→ La prueba se basa en qué tan buen ajuste o concordancia se tiene entre las frecuencias de
ocurrencia de las
observaciones en una muestra observada y las frecuencias esperadas que se obtienen a partir
de la
distribución hipotética.
- El estadístico de prueba tiene distribución chi cuadrado con (k-1) grados de libertad, donde k
es la
cantidad total de valores que tiene la distribución analizada.
- Ho: La variable tiene la distribución supuesta (en este lugar se especifican los aspectos a
probar, ya sea
una descripción de cómo distribuye, o con el nombre de la distribución conocida y sus
parámetros
correspondientes)
- H1: La variable no sigue la distribución supuesta.
En las pruebas chi cuadrado de bondad de ajuste, siempre se coloca el riesgo de
no aceptar la hipótesis nula siendo ésta cierta (el nivel de significación, α) en el
extremo superior de valores de la distribución chi cuadrado, como muestra la
siguiente figura:
Como puede observarse en el estadístico de prueba, el valor que surja a partir de los datos
muéstrales será
elevado cuando difieran sistemáticamente las frecuencias observadas de las esperadas (que se
construyen
teniendo en cuenta la distribución hipotética indicada en la hipótesis nula). Por ello es que
valores elevados
del estadístico caerán en la zona de rechazo.
Prueba de independencia de 2 variables categóricas.
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga Informacion para TP3 Est 2 S21 y más Ejercicios en PDF de Estadística solo en Docsity!

ESTADÍSTICA 2

Documentación y Trabajo practico: Documentación correspondiente: Prueba de variables categóricas. Prueba de bondad de ajuste. → Sirve para determinar si una población tiene una distribución teórica específica, ya sea una distribución conocida o una distribución ad hoc. → La prueba se basa en qué tan buen ajuste o concordancia se tiene entre las frecuencias de ocurrencia de las observaciones en una muestra observada y las frecuencias esperadas que se obtienen a partir de la distribución hipotética.

  • El estadístico de prueba tiene distribución chi cuadrado con (k-1) grados de libertad, donde k es la cantidad total de valores que tiene la distribución analizada.
  • Ho: La variable tiene la distribución supuesta (en este lugar se especifican los aspectos a probar, ya sea una descripción de cómo distribuye, o con el nombre de la distribución conocida y sus parámetros correspondientes)
  • H1: La variable no sigue la distribución supuesta. En las pruebas chi cuadrado de bondad de ajuste, siempre se coloca el riesgo de no aceptar la hipótesis nula siendo ésta cierta (el nivel de significación, α) en el extremo superior de valores de la distribución chi cuadrado, como muestra la siguiente figura: Como puede observarse en el estadístico de prueba, el valor que surja a partir de los datos muéstrales será elevado cuando difieran sistemáticamente las frecuencias observadas de las esperadas (que se construyen teniendo en cuenta la distribución hipotética indicada en la hipótesis nula). Por ello es que valores elevados del estadístico caerán en la zona de rechazo. Prueba de independencia de 2 variables categóricas.

→ Permite establecer si existe o no relación entre variables categóricas, cuando cada una de las cuales posee dos o más categorías. (La prueba Chi cuadrada es una prueba de carácter general que se utiliza cuando se desea determinar si las frecuencias absolutas obtenidas en la observación, difieren significativamente o no de las que se esperarían bajo cierta hipótesis planteada de interrelación de las categorías de las variables consideradas.)

  • Ambas variables se consideran conjuntas en una tabla de contingencia.
  • Ho: Las variables son independientes entre sí (es decir, no tienen relación)
  • H1: Las variables no son independientes. Si bien estamos interesados en considerar la vinculación entre las variables, la hipótesis nula parte del supuesto neutral de no relación o independencia. En el caso de rechazar la hipótesis nula, detectaremos la relación que suponemos que existe, que motivó el estudio.
  • El estadístico justamente considerará esta situación, en la cual, si los valores observados se distancian significativamente del valor esperado bajo el supuesto de independencia, el estadístico resultará en un valor elevado (ubicado en la zona de rechazo), y se rechazará la hipótesis nula. El estadístico Chi cuadrado está dado por: Se distribuye Chi cuadrado con (c-1).(f-1) grados de libertad. Donde: fo: frecuencias observadas fe: frencuencias esperadas → = (Suma de renglones x Suma de columnas) / n c= número de columnas f= número de filas También en la prueba chi cuadrado de independencia se localiza el riesgo de no aceptar la hipótesis nula siendo ésta cierta (el nivel de significación, α) en el extremo superior de valores de la distribución chi cuadrado, como muestra la siguiente figura: Nuevamente puede observarse que si las frecuencias esperadas (bajo la hipótesis nula cierta de

Separación de la suma de cuadrados. → La idea básica del ANOVA es el hecho de que las varianzas pueden ser divididas, es decir separadas. (Recordar que la varianza se calcula como la suma de desviaciones al cuadrado respecto de la media general dividida por n-1). Por eso, para una muestra de tamaño n, la varianza es una función de las sumas de cuadrados (de desvíos), a la cual denominaremos SS. La partición de la varianza funciones como mostraremos a continuación: Lógica básica del ANOVA.

  • El propósito del análisis de varianza es probar si son estadísticamente significativas las diferencias en las medias para tres ó más grupos de casos. Para ello se analiza la varianza, particionando la varianza total en sus componentes: el que se debe al error aleatorio (Suma de cuadrados dentro de los grupos) y el que se debe a las diferencias entre las medias (Suma de cuadrados entre los grupos).
  • Estos componentes de la varianza son sometidos a la prueba de significación estadística, y si resulta significativa, se rechaza la hipótesis nula referida a la no existencia de diferencia entre las medias y se concluye que hasta nueva evidencia se mantiene como válida la hipótesis alternativa referida a que las medias de la población son diferentes entre sí (o más precisamente, que al menos una de las medias consideradas lo es). → En la prueba ANOVA, las hipótesis se explicitan de la siguiente manera:
  • Hipótesis nula: Ho: Las medias de los c grupos son iguales
  • Hipótesis alternativa: Al menos una de las medias de los grupos es diferente a las demás. Dispersión total. → La variación total (SST) está dada por la suma de cuadrados de todos los valores respecto de la media del total de datos o gran media.

Donde: Variación total. SST Variación ENTRE grupos. SSE ó SSA Variación DENTRO de grupos. SSD ó SSW X´ es la gran media → Xij es la i-ésima observación del grupo j n j indica la cantidad de casos del grupo j c es la cantidad de grupos. Dispersión entre grupos. → La variación o dispersión entre grupos se resume a través de la suma de cuadrados entre grupos (SSE ó SSA), que considera las diferencias entre las medias de cada grupo y la gran media. Donde: X j es la media del grupo j Dispersión dentro de grupos. → La variación o dispersión dentro grupos considera la suma de cuadrados dentro de grupos (SSD ó SSW), que tiene en cuenta las diferencias entre cada uno de los valores observados en cada grupo y la media correspondiente a su grupo. Donde: Xij es la i-ésima observación del grupo j X j es la media del grupo j → Cada una de las sumas de cuadrados descriptas tiene asociados grados de libertad diferentes:

  • La SST tiene n-1 grados de libertad, ya que pierde un grado de libertad respecto del total de datos de la muestra, por el cálculo de la gran media

manera que resulte por encima de este valor, una probabilidad igual al nivel de significación elegido. Siempre la zona de rechazo se ubica en el extremo superior de la distribución. Los valores altos del estadístico F permiten rechazar la hipótesis nula. La regla de decisión queda determinada de la siguiente manera:

  • Si el estadístico muestral F es mayor o igual al valor crítico, se rechaza la hipótesis nula (y en consecuencia no puede afirmarse que las medias de todos los grupos son iguales).
  • Si el estadístico muestral F es menor al valor crítico, no se rechaza la hipótesis nula (y en consecuencia no disponemos de evidencia para descartar que las medias de todos los grupos sean iguales). *Toda la información requerida para un ANOVA se sintetiza en una tabla ANOVA. (Ejemplo) → Prueba de Tukey Kramer El hecho de rechazar la hipótesis nula de un ANOVA no nos dice nada acerca de las diferencias de las medias entre sí, sólo nos permite asegurar que tal diferencia es significativa, en al menos una de las medias consideradas. Para poder identificar cuál o cuáles medias difieren se realizan pruebas como el test de Tuckey, que posibilitan su detección.
  • Dado que estas pruebas se realizan una vez que ha sido rechazada la hipótesis nula del ANOVA, a posteriori, se denominan post hoc. Procedimiento: 1 - Se calculan las diferencias de a pares de todos los grupos para todo , es decir para todas las medias de diferentes grupos. En total serán necesarias comparaciones de medias de a pares. 2 - Se debe obtener el alcance crítico, con la siguiente fórmula: *Si los tamaños de las muestras de cada grupo son diferentes debe calcularse el ac para cada par de medias de muestra.
  • El valor de Q se obtiene de la tabla correspondiente a la tabla de Tukey Kramer. 3 - Finalmente se comparan las diferencias obtenidas en el paso 1 con el ac que le corresponde.
  • Si la diferencia obtenida excede al ac, pueden considerarse distintas las medias respectivas. Supuestos del ANOVA.
  1. Aleatoriedad o independencia de errores. Es imprescindible garantizar la aleatoriedad en la asignación de los casos a los diferentes niveles del tratamiento, ya que, de lo contrario, no será posible arribar a conclusiones correctas acerca del efecto del nivel del tratamiento o grupo al cual está asignado el caso, sobre la variable dependiente.
  2. Normalidad. Los datos deben distribuirse de manera normal en torno de la media de cada grupo.
  3. Homogeneidad de varianzas. Las varianzas de todos los grupos deben ser iguales. Este supuesto es crítico, y puede verificarse su cumplimiento a través de un test de Levene de igualdad de varianzas. Si las muestras tienen igual tamaño, no se verá afectado el resultado del ANOVA por la falta de cumplimiento de este supuesto. TP 3 Dato de Trabajo practico Enunciado de la actividad Con frecuencia, las organizaciones bancarias requieren tener indicios sobre el comportamiento de sus deudores para determinar si un deudor dado responderá o no a sus obligaciones de pago. El Banco Ciudad, luego de un estudio realizado en función de las características de las deudas como el motivo de mora, monto adeudado, intencionalidad de pago, tiempo que está en mora, entre otras, logró identificar los siguientes perfiles:
  4. Deudor común: es el que paga la deuda en el plazo establecido para ello.
  5. Deudor solidario: también llamado codeudor, es la persona a la que se le puede exigir legalmente el pago de una deuda contraída por el deudor principal.
  6. Deudor insolvente: es el que declara que no tiene los medios necesarios