








































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos y ejemplos de pruebas de hipótesis estadísticas con aplicaciones en R
Tipo: Guías, Proyectos, Investigaciones
Oferta a tiempo limitado
Subido el 21/11/2019
4.8
(8)7 documentos
1 / 48
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
En oferta
4.1 Introducción 1
Una de las áreas más importantes en el campo de la estadística aplicada es la que se conoce como prueba de hipótesis o contraste de hipótesis. La utilidad de la prueba de hipótesis proviene del hecho de constituir uno de los instrumentos más apropiados para tomar decisiones en condiciones de incertidumbre. El procedimiento formal para realizar pruebas de hipótesis se asemeja en muchos aspectos al método científico. En este contexto el investigador propone una hipótesis respecto a uno o más parámetros de una población, el cual afirma que los valores específicos son iguales. En seguida toma una muestra de la población, y compara sus observaciones con la hipótesis; si esta no concuerda con ellas la rechaza. De lo contrario, concluye que la hipótesis es verdadera o que la muestra no revela si hay diferencia entre los valores reales y los hipotéticos de los parámetros poblacionales. Las estadísticas desempeñan un papel importante en la toma de decisiones. En estadística, se utilizan muestras aleatorias para hacer inferencias sobre la población de la que se obtuvieron las muestras. La inferencia estadística de los parámetros poblacionales adopta dos formas: la estimación y la comprobación de hipótesis, aunque ambas pueden verse como aspectos diferentes del mismo problema general de llegar a decisiones sobre la base de los datos observados. Ya hemos visto varios procedimientos de estimación en capítulos anteriores. La prueba de hipótesis es el tema de este capítulo. Este tiene un papel importante en la aplicación de las estadísticas a problemas de la vida real. Aquí utilizamos los datos muestreados para tomar decisiones sobre la distribución desconocida de una población o sus parámetros. El trabajo pionero en la formulación explícita, así como los conceptos fundamentales de la teoría de la prueba de hipótesis se debe a J. Neyman y E.S. Pearson. Una hipótesis estadística es una afirmación relativa a la distribución de probabilidad de una variable aleatoria o de parámetros de población que son inherentes a una distribución de proba- bilidad. El siguiente ejemplo ilustra el concepto de prueba de hipótesis. Un problema industrial importante es el de aceptar o rechazar lotes de productos manufacturados. Antes de entregar cada lote al consumidor, el fabricante suele realizar algunas pruebas para determinar si el lote cumple
con las normas aceptables. Digamos que tanto el fabricante como el consumidor están de acuerdo en que si la proporción de unidades defectuosas en un lote es inferior o igual a un cierto número p , el lote será liberado. Muy a menudo, en lugar de probar cada artículo en el lote, podemos probar sólo unos pocos al azar del lote y tomar decisiones sobre la proporción de unidades defectuosas en el lote, es decir, tomamos las decisiones sobre la población en base a la información de la mues- tra. Tales decisiones se denominan decisiones estadísticas. En el intento de tomar decisiones, es útil hacer algunas suposiciones iniciales sobre la población involucrada. Tales suposiciones son llamadas hipótesis estadísticas. A veces los resultados de la muestra pueden ser marcadamente diferentes de las esperadas bajo la hipótesis. Entonces podemos decir que las diferencias observadas son significativas y nos inclinaríamos a rechazar la propuesta inicial. Los procedimientos que nos permiten decidir si rechazamos o no las hipótesis o para determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman pruebas de hipótesis, pruebas de significación o reglas de decisión.
En cualquier problema de prueba de hipótesis, formulamos una hipótesis nula y una hipótesis alternativa tal que si rechazamos la nula, entonces tenemos que aceptar la alternativa. La hipótesis nula suele ser una declaración de “statu quo” o “sin efecto”. Una pauta para seleccionar una hipótesis nula es que cuando el objetivo de un experimento es establecer una reivindicación, la anulación de la reivindicación debe tomarse como hipótesis nula. El experimento se realiza a menudo para determinar si la hipótesis nula es falsa. Por ejemplo, suponga que la fiscalía quiere establecer que cierta persona es culpable. La hipótesis nula sería que la persona es inocente y la alternativa sería que la persona es culpable. Así, el reclamo en sí mismo se convierte en la hipótesis alternativa. Habitualmente, la hipótesis alternativa es la afirmación que el experimentador cree que es cierta. Por ejemplo, la hipótesis alternativa es la razón por la que una persona es arrestada (la policía sospecha que la persona no es inocente). Una vez que se han establecido las hipótesis, se utilizan procedimientos estadísticos apropiados para determinar si se debe rechazar la hipótesis nula. Para el procedimiento de prueba, uno comienza con la suposición de que la hipótesis nula es verdadera. Si la información proporcionada por los datos muestreados contradice fuertemente (más allá de una duda razonable) la hipótesis nula, entonces la rechazamos a favor de la hipótesis alternativa. Si no rechazamos la hipótesis nula, entonces automáticamente rechazamos la hipótesis alternativa. Tenga en cuenta que siempre tomamos una decisión con respecto a la hipótesis nula. El no rechazar la hipótesis nula no significa necesariamente que la hipótesis nula sea verdadera. Por ejemplo, el hecho de que una persona sea juzgada “inocente” no significa que sea inocente. Esto significa básicamente que no hay pruebas suficientes para rechazar la hipótesis nula (presunción de inocencia) más allá de “una duda razonable”. A continuación resumimos los elementos de una prueba estadística.
Elementos de una prueba estadística
Al plantear una hipótesis estadística sobre el parámetro de una población, lo que se hace es particionar el espacio Ω en dos subespacios Ω 0 y Ω 1. Teóricamente, al particionar el espacio del parámetro en dos subespacios, se debe incluir en uno u otro subespacio todos los posibles valores del parámetro, es decir Ω 0 ∪ Ω 1 = Ω, pero Ω 0 ∩ Ω 1 = ∅.
Si en una población normal, planteamos la hipótesis de que la media es igual a 20, estamos particionando Ω en dos subespacios:
Ω 0 = { μ | μ = 20} Ω 1 = { μ | μ , 20 }
En una población binomial, si planteamos la hipótesis de que p ≤ 1 / 4, estamos particionando Ω en dos subespacios: Ω 0 = { p | p ≤ 1 / 4 } Ω 1 = { p | p > 1 / 4 }
Definición 4. Una hipótesis estadística es una hipótesis simple, si el correspondiente subespacio del pa- rámetro contiene un solo punto; es decir, si especifica un solo valor del parámetro. Una hipótesis estadística es una hipótesis compuesta, si el correspondiente subespacio del pa- rámetro contiene más de un punto; es decir, si la hipótesis especifica más de un valor del parámetro.
En el ejemplo 4.3, Ω 0 corresponde a una hipótesis simple, y en el ejemplo 4.4, Ω 0 corresponde a una hipótesis compuesta. En la siguiente sección formalizaremos los conceptos aquí descritos de manera empírica.
Uno de los objetivos de una prueba estadística es el de demostrar una hipótesis relacionada con los valores de uno o más parámetros poblacionales. Por lo general, disponemos de una teoría -una hipótesis de investigación - respecto a los parámetros, que queremos sustentar. Por ejemplo, supongamos que un candidato arguye que obtendrá más de 50 % de los votos de una ciudad y, por consiguiente, que ganará las elecciones. Si los argumentos del candidato no son convincentes, podríamos plantear la hipótesis de investigación de que menos del 50 % del electorado es partidario del candidato. La verificación de esta hipótesis, también llamada hipótesis alternativa, se consigue demostrando (con los datos de la muestra como evidencia) que la hipótesis contraria de la hipótesis alternativa, llamada hipótesis nula, es falsa.
Definición 4. La hipótesis nula, H 0 , es la hipótesis por probar. La hipótesis alternativa (o de investigación ), Ha , es la hipótesis que se acepta si se rechaza H 0. La hipótesis alternativa es, por lo general, la hipótesis que queremos comprobar con base en la información de la muestra. El estadístico de prueba es una función de las mediciones de la muestra que sirve de fundamento para la toma de decisiones estadísticas. La región de rechazo, que denotaremos mediante RR ,
4.2 Elementos de una prueba estadística 5
especifica los valores del estadístico de prueba para los que la hipótesis nula se rechaza a favor de la hipótesis alternativa.
Cuando una hipótesis estadística es rechazada o aceptada con base en los resultados de una muestra, siempre existe la posibilidad de tomar una decisión equivocada. Hay dos tipos de error que se pueden cometer. Uno es rechazar la hipótesis nula siendo verdadera; otro es aceptar la hipótesis nula siendo falsa. Definición 4. Se comete un error tipo I si se rechaza H 0 cuando H 0 es verdadero. La probabilidad de cometer un error tipo I se denota mediante α. Esto es
P (rechazar H 0 | H 0 es verdadera) = α.
El valor de α se denomina nivel de la prueba, PH 0 ( θ ∈ Ω) = α. Se comete un error tipo II si se acepta H 0 cuando Ha es verdadera. La probabilidad de cometer un error tipo II se denota mediante β , esto es
P (no rechazar H 0 | H 0 es falsa) = PHa ( θ ∈ Ω c ) = β.
Es deseable que una prueba tenga α = β = 0 (esto se puede lograr sólo en casos triviales), o al menos preferimos usar una prueba que minimice ambos tipos de errores.
Los errores que se pueden cometer, así como las acciones correctas se resumen en la tabla siguiente:
Hipótesis ` Decisión (^) Aceptar _H_ 0 Rechazar^ _H_ 0 _H_ 0 : _θ_ ∈ Ω 0 Acción Error verdadera correcta tipo I _H_ 0 : _θ_ ∈ Ω 1 Error Acción falsa tipo II correcta Cuadro 4.1: Acciones estadísticas y errores en una prueba estadística Definición 4. Definimos _π_ = 1 − _β_ = _P_ (rechazar _H_ 0 cuando _θ_ = _θa_ ), como la potencia de la prueba. _π_ representa la probabilidad de no cometer un error tipo II. Según el censo de 1961, el alquiler promedio mensual pagado en Venezuela por viviendas familiares (de menos de Bs. 1.000,00 mensuales) fue de Bs. 313,00. Se desea saber si el alquiler aumentó entre 1961 y 1972. Para ello se tomó la siguiente decisión: Si el alquiler medio resultante de una muestra era mayor de Bs. 315,00 se acepta que el alquiler se ha incrementado significativamente. Definir el espacio de los parámetros, la hipótesis nula y la 4.2 Elementos de una prueba estadística 7 luego _α_ = _P_ (error tipo I) = _P_ ( _x_ ≤ 12; _p_ = 0 _,_ 8) = ### ∑^12 _k_ = _k_ (0 _,_ 8) _k_^ (1 − 0 _,_ 8)^20 − _k_^ = 0 _,_ 032_._ 3. Un error tipo II sería concluir que el medicamento induce el sueño en el 80 % de los pacientes, esto es, se acepta el medicamento aunque no es efectivo. 4. Tenemos que _β_ = _P_ (error tipo II) luego, para _p_ = 0 _,_ 6, se tiene _β_ = _P_ (error tipo II) = _P_ ( _x >_ 12; _p_ = 0 _,_ 6) = ### ∑^20 _k_ = _k_ (0 _,_ 6) _k_^ (1 − 0 _,_ 6)^20 − _k_^ = 0 _,_ 416_._ 5. Para _p_ = 0 _,_ 4, se tiene _β_ = _P_ (error tipo II) = _P_ ( _x >_ 12; _p_ = 0 _,_ 4) = ### ∑^20 _k_ = _k_ (0 _,_ 4) _k_^ (1 − 0 _,_ 4)^20 − _k_^ = 0 _,_ 021_._ Podemos notar que el valor de _β_ depende del valor del parámetro _p_ , esto sucede siempre que la hipótesis alternativa sea compuesta. Tipos de regiones críticas o de rechazo: Supongamos que _H_ 0 es simple: _θ_ = _θ_ 0 1. Si _Ha_ es _θ > θ_ 0 , la prueba es unilateral derecha o de una cola superior. 2. Si _Ha_ es _θ < θ_ 0 , la prueba es unilateral izquierda o de una cola inferior. 3. Si _Ha_ es _θ_ , _θ_ 0 , la prueba es bilateral o de dos colas. Véase la Figura 4.1. Una prueba con una hipótesis alternativa de cola inferior o superior se denomina prueba de cola única. Una de las cuestiones en la prueba de hipótesis es la elección de la forma de la hipótesis alternativa. Nótese que, como hemos discutido anteriormente, la hipótesis nula siempre se refiere a la pregunta planteada: la afirmación. La hipótesis alternativa debe reflejar el objetivo de la alegación cuando en realidad la rechazamos; queremos saber por qué la rechazamos. Por ejemplo, supongamos que una compañía farmacéutica afirma que el medicamento _A_ tiene una eficacia del 80 % (es decir, _p_ = 0 _,_ 8). Llevamos a cabo un experimento, ensayos clínicos para probar esta afirmación. Por lo tanto, la hipótesis nula es que la afirmación es cierta. Ahora bien, si no queremos rechazar la hipótesis nula, no hay problema, pero si rechazamos la hipótesis nula, queremos saber por qué. Por lo tanto, la hipótesis alternativa debe ser una prueba de cola inferior, _p <_ 0 _,_ 8, es decir, la afirmación no es verdadera. Si usáramos una prueba de dos colas, no sabríamos si el rechazo era debido a que _p <_ 0 _,_ 8 o _p >_ 0 _,_ 8, en este caso es realmente parte de la hipótesis nula. Es importante tener en cuenta que cuando se utiliza la prueba de un lado en una dirección determinada, si la consecuencia de perder un efecto en la otra dirección no es insignificante, es mejor utilizar la prueba de dos lados. Figura 4.1: Tipos de regiones de rechazo. Prueba bilateral (arriba), prueba unilateral izquierda (abajo izquierda) y prueba unilateral derecha (abajo derecha) Tampoco es apropiado elegir una prueba de una cola después de hacer una prueba de dos colas que no rechazó la hipótesis nula. Por lo tanto, la elección de la hipótesis alternativa se basa en lo que sucede si rechazamos la hipótesis nula. En un problema de prueba de hipótesis aplicada, podemos utilizar los siguientes pasos generales. Método general para la prueba de hipótesis 1. A partir del problema (de palabra), determinar la hipótesis nula apropiada, _H_ 0 , y la alternativa, _Ha_. 2. Identificar los estadísticos de prueba apropiadas y calcular el estadístico de prueba observado a partir de los datos. 3. Encuentre la región de rechazo buscando el valor crítico en la tabla apropiada. 4. Sacar la conclusión: Rechazar o no rechazar la hipótesis nula, _H_ 0. 5. Interpretar los resultados: Declarar en palabras lo que significa la conclusión del problema con el que empezamos. Siempre es necesario establecer una hipótesis nula y otra alternativa para cada prueba estadís- tica realizada. Todos los resultados posibles deben ser tomados en cuenta por las dos hipótesis. Nótese que, un valor crítico es el valor que un estadístico de prueba debe sobrepasar para que la hipótesis nula sea rechazada, y se deriva del nivel de significación _α_ de la prueba. Por lo tanto, los valores críticos son los límites de la región de rechazo. Es importante observar que tanto las hipótesis nulas como las alternativas se expresan en términos de parámetros, no en términos estadísticos. ## 4.3 El lema de Neyman-Pearson En situaciones prácticas de prueba de hipótesis, hay típicamente muchas pruebas posibles con el nivel de significación _α_ para una hipótesis nula versus una hipótesis alternativa. Esto lleva a algunas preguntas importantes, tales como (1) cómo decidir sobre la prueba estadística y (2) cómo saber que hemos seleccionado la mejor región de rechazo. En esta sección, estudiamos la respuesta a estas preguntas utilizando el enfoque Neyman-Pearson. grande que el _α_ dado se llama la prueba más potente. Considere la prueba de la hipótesis _H_ 0 : _θ_ = _θ_ 0 versus _Ha_ : _θ_ = _θ_ 1. Si _α_ es fijo, entonces nuestro interés es hacer _β_ lo más pequeño posible. Debido a que _β_ = 1 − _P otencia_ ( _θ_ 1 ), minimizando _β_ obtendríamos una prueba muy poderosa. El resultado siguiente dice que entre todas las pruebas con una probabilidad dada de error de tipo I, la prueba del cociente de verosimilitud minimiza la probabilidad de un error de tipo II, en otras palabras, es la más poderosa. Teorema 4.3.1 – Lema de Neyman-Pearson. Supongamos que queremos probar una hipótesis simple _H_ 0 : _θ_ = _θ_ 0 versus la hipótesis alternativa simple _Ha_ : _θ_ = _θ_ 1 basada en una muestra aleatoria _X_ 1 _,... , Xn_ de una distribución con parámetro _θ_. Sea _L_ ( _θ_ ) ≡ _L_ ( _θ_ ; _X_ 1 _,... , Xn_ ) _>_ 0 la verosimilitud de la muestra cuando el valor del parámetro es _θ_. Si existe una constante positiva _K_ y un subconjunto _C_ del espacio muestral R _n_^ (el _n_ -espacio euclídeo) tal que 1. _L L_ (( _θθ_^01 )) ≤ _K_ para ( _x_ 1 _, x_ 2 _,... , xn_ ) ∈ _C_ , 2. _L L_ (( _θθ_^01 )) ≥ _K_ para ( _x_ 1 _, x_ 2 _,... , xn_ ) ∈ _Cc_ , donde _Cc_^ es el complemento de _C_ , y 3. _P_ [( _X_ 1 _,... , Xn_ ) ∈ _C_ : _θ_ 0 ] = _α_. Entonces la prueba con la región crítica _C_ será la prueba más potente para _H_ 0 versus _Ha_. Llamamos _α_ el tamaño de la prueba y _C_ la mejor región crítica de tamaño _α_. Demostración Haremos la demostración para variables aleatorias continuas. Para variables discretas la demostración es idéntica reemplazando las integrales por sumas. Sea _S_ alguna región en R _n_ , un espacio euclídeo _n_ -dimensional. Por simplicidad usaremos la siguiente notación ∫ _S_ _L_ ( _θ_ ) = _S_ _S_ _L_ ( _θ_ ; _x_ 1 _, x_ 2 _,... , xn_ ) _dx_ 1 _dx_ 2_... dxn_ Note que _P_ (( _X_ 1 _,... , Xn_ ) ∈ _C_ ; _θ_ ) = _C_ _f_ ( _x_ 1 _,... , xn_ ; _θ_ ) _dx_ 1_... dxn_ _C_ _L_ ( _θ_ ; _x_ 1 _,... , xn_ ) _dx_ 1_... dxn_ Supongamos que existe otra región crítica _B_ , de tamaño menor o igual a _α_ , esto es, _B L_ ( _θ_^0 )^ ≤ _α_. Entonces 0 ≤ _C_ _L_ ( _θ_ 0 ) − _B_ _L_ ( _θ_ 0 ), dado que _C_ _L_ ( _θ_ 0 ) = _α_ por suposición 3. Por lo tanto, 0 ≤ _C_ _L_ ( _θ_ 0 ) − _B_ _L_ ( _θ_ 0 ) _C_ ∩ _B_ _L_ ( _θ_ 0 ) + _C_ ∩ _Bc_ _L_ ( _θ_ 0 ) − _C_ ∩ _B_ _L_ ( _θ_ 0 ) − _Cc_^ ∩ _B_ _L_ ( _θ_ 0 ) _C_ ∩ _Bc_ _L_ ( _θ_ 0 ) − _Cc_^ ∩ _B_ _L_ ( _θ_ 0 )_._ 4.3 El lema de Neyman-Pearson 11 Usando la suposición 1, _KL_ ( _θ_ 1 ) ≥ _L_ ( _θ_ 0 ) en cada punto de la región _C_ y por consiguiente en _C_ ∩ _Bc_. Por lo tanto (^) ∫ _Cc_^ ∩ _B_ _L_ ( _θ_ 0 ) _K_ ≥ _Cc_^ ∩ _B_ _L_ ( _θ_ 1 )_._ En consecuencia, 0 ≤ _C_ ∩ _Bc_ _L_ ( _θ_ 0 ) − _Cc_^ ∩ _B_ _L_ ( _θ_ 0 ) ### ≤ K _C_ ∩ _Bc_ _L_ ( _θ_ 1 ) − _Cc_^ ∩ _B_ _L_ ( _θ_ 1 ) Esto es, ### 0 ≤ K _C_ ∩ _B_ _L_ ( _θ_ 1 ) + _C_ ∩ _Bc_ _L_ ( _θ_ 1 ) − _C_ ∩ _B_ _L_ ( _θ_ 1 ) − _Cc_^ ∩ _B_ _L_ ( _θ_ 1 ) ### = K _C_ _L_ ( _θ_ 1 ) − _B_ _L_ ( _θ_ 1 ) Como resultado (^) ∫ _C_ _L_ ( _θ_ 1 ) ≥ _B_ _L_ ( _θ_ 1 )_._ Debido a que esto es cierto para cada región crítica _B_ de tamaño _α_ , _C_ es la mejor región crítica de tamaño _α_ , y la prueba con la región crítica _C_ es la prueba más potente de tamaño _α_. Al probar dos hipótesis simples, la existencia de la mejor región crítica está garantizada por el lema de Neyman-Pearson. Además, el teorema anterior proporciona un medio para determinar cuál es la mejor región crítica. Sin embargo, es importante notar que el Teorema 4.3.1 da sólo la forma de la región de rechazo; la región de rechazo real depende del valor específico de _α_. En situaciones del mundo real, rara vez se nos presenta el problema de probar dos hipótesis simples. No hay un resultado general en la forma del Teorema 4.3.1 para las hipótesis compuestas. Sin embargo, para las hipótesis de la forma _H_ 0 : _θ_ = _θ_ 0 versus _Ha_ : _θ > θ_ 0 , podemos tomar un valor particular _θ_ 1 _> θ_ 0 y luego encontrar una prueba más poderosa para _H_ 0 : _θ_ = _θ_ 0 versus _Ha_ : _θ > θ_ 1. Si esta prueba (es decir, la región de rechazo de la prueba) no depende del valor particular _θ_ 1 , entonces se dice que esta prueba es una prueba uniformemente más potente (UMP) para _H_ 0 : _θ_ = _θ_ 0 versus _Ha_ : _θ > θ_ 0. El siguiente ejemplo ilustra el uso del lema de Neyman-Pearson. Sea _X_ 1 _,... , Xn_ una muestra aleatoria independiente de una población con una distribución de Poisson con media _λ_. Derive la prueba más potente para probar _H_ 0 : _λ_ = 2 versus _Ha_ : _λ_ = 1 _/_ 2. Solución Recordemos la distribución de probabilidad de una variable Poisson _p_ ( _x_ ) = _e_ − _λλx x_! _,_^ para^ _λ >_^^0 _, x_^ = 0 _,_^^1 _,_^^2 _,..._ 0 _,_ en otro caso 4.4 Niveles de significancia alcanzados o valores _p_ 13 Definición 4. Un valor p o p-valor es el nivel más bajo de significancia en el cual el valor observado del estadístico de prueba es significativo. Cuanto menor sea el _p_ -valor, más convincente será la evidencia que favorece el rechazo de la hipótesis nula. Diversas revistas científicas exigen a los investigadores que incluyan los _p_ -valores respecto a pruebas estadísticas, ya que estos valores proporcionan al lector _más información_ de la que contiene el enunciado de que la hipótesis nula fue o no rechazada para algún valor de _α_ elegido por el investigador. Basado en la hipótesis alternativa, podemos usar los siguientes pasos para calcular el _p_ -valor Pasos para calcular el _p_ -valor 1. Sea _T_ un estadístico de prueba 2. Calculamos el valor de _T_ usando la muestra _X_ 1 _,... , Xn_ , denotamos este valor por _Tobs_. 3. El _p_ -valor estará dado por _p_ − valor = _P_ ( _T < Tobs_ | _H_ 0 ) _,_ si la prueba es de cola inferior _P_ ( _T > Tobs_ | _H_ 0 ) _,_ si la prueba es de cola superior _P_ (| _T_ | _>_ | _Tobs_ || _H_ 0 ) _,_ si la prueba es bilateral Para probar _H_ 0 : _μ_ = 0 frente a _Ha_ : _μ_ ,= 0, supongamos que el estadístico de prueba _Z_ da como resultado un valor calculado de 1,58. Entonces, el _p_ -valor = _P_ (| _Z_ | _>_ 1 _,_ 58) = 2(0 _,_ 0571) = 0 _,_ 1142. Es decir, debemos tener un error tipo I de 0.1142 para poder rechazar _H_ 0. Además, si _Ha_ : _μ >_ 0, entonces el _p_ -valor sería _P_ ( _Z >_ 1 _,_ 58) = 0 _,_ 0582. En este caso debemos tener un _α_ de 0.0582 para poder rechazar _H_ 0. El _p_ -valor puede ser pensado como una medida de apoyo para la hipótesis nula: Cuanto menor sea su valor, menor será el soporte. Típicamente uno decide que el soporte para _H_ 0 es insuficiente cuando el _p_ -valor cae por debajo de un umbral particular, que es el nivel de significación de la prueba. Informe de los resultados de la prueba de hipótesis como _p_ -valor 1. Elegimos el valor máximo de _α_ que estamos dispuesto a tolerar. 2. Si el _p_ -valor de la prueba es inferior al valor máximo de _α_ , rechazamos _H_ 0. Si no podemos encontrar el _p_ -valor exacto, podemos dar un intervalo en el que el _p_ -valor pueda estar. Por ejemplo, si la prueba es significativa en _α_ = 0 _,_ 05 pero no es significativa para _α_ = 0 _,_ 025, reportamos que 0 _,_ 025 ≤ _p_ −valor ≤ 0 _,_ 05. Por lo tanto, para _α >_ 0 _,_ 05, rechazamos _H_ 0 , y para _α <_ 0 _,_ 025, no rechazamos _H_ 0. En otra interpretación, 1 − ( _p_ − valor ) se considera como un índice de la fuerza de las pruebas contra la hipótesis nula proporcionada por los datos. Está claro que el valor de este índice se encuentra en el intervalo [0 _,_ 1]. Si el _p_ -valor es 0,02, el valor del índice es 0,98, apoyando el rechazo de la hipótesis nula. Los _p_ -valores no sólo nos proporcionan una respuesta de sí o no, proporcionan un sentido de la fuerza de la evidencia contra la hipótesis nula. Cuanto más bajo sea el _p_ -valor, más fuertes serán las pruebas. Así, en cualquier prueba, reportar el _p_ -valor de la prueba es una buena práctica. Debido a que la mayoría de los resultados de los software estadísticos utilizado para la prueba de hipótesis incluyen el _p_ -valor, el enfoque del _p_ -valor para la prueba de hipótesis se está volviendo cada vez más popular. En este enfoque, la decisión de la prueba se toma de la siguiente manera. Si se da el valor de _α_ , y si el _p_ -valor de la prueba es menor que el valor de _α_ , rechazaremos _H_ 0. Si no se da el valor de _α_ y el _p_ -valor asociado con la prueba es pequeño (normalmente fijado en el valor _p <_ 0 _,_ 05), hay evidencia para rechazar la hipótesis nula a favor de la alternativa. En otras palabras, hay evidencia de que el valor del verdadero parámetro (como la media de la población) es significativamente diferente (mayor o menor) que el valor hipotético. Si el _p_ -valor asociado con la prueba no es pequeño ( _p >_ 0 _,_ 05), concluimos que no hay suficiente evidencia para rechazar la hipótesis nula. En la muchos de los ejemplos de este capítulo, daremos tanto la región de rechazo como el _p_ -valor y su interpretación. La gerencia de un gimnasio local afirma que sus socios pierden un promedio de 15 libras o más en los primeros 3 meses después de unirse al club. Para verificar esta afirmación, una agencia de consumidores tomó una muestra aleatoria de 45 miembros de este club de salud y encontró que perdieron un promedio de 13.8 libras en los primeros 3 meses de membresía, con una muestra de desviación estándar de 4.2 libras. 1. Determinar el _p_ -valor para esta prueba. 2. Basado en el _p_ -valor en (1), ¿rechazaría la hipótesis nula para _α_ = 0 _,_ 01? Solución 1. Sea _μ_ el verdadero promedio de pérdida de peso en libras dentro de los primeros 3 meses de membresía en este club. Entonces tenemos que probar la hipótesis _H_ 0 : _μ_ = 15 versus _Ha_ : _μ <_ 15_._ Aquí _n_ = 45 _, x_ ¯ = 13 _,_ 8, y _s_ = 4 _,_ 2. Debido a que _n_ = 45 _>_ 30, podemos usar la aproximación normal. Por lo tanto, el estadístico de prueba es _z_ = y _p_ -valor = _P_ ( _Z <_ − 1 _,_ 9166) ∼ _P_ ( _Z <_ − 1 _,_ 92) = 0 _,_ 0274_._ Por lo tanto, podemos usar _α_ tan pequeño como 0.0274 y aún así rechazar _H_ 0. 2. No. Debido a que el _p_ -valor=0.0274 es mayor que _α_ = 0 _,_ 01, no se puede rechazar _H_ 0. En cualquier prueba de hipótesis, después de que determinamos el objetivo de un experimento y decidimos el tipo de datos que deben recopilarse, podemos valernos del siguiente procedimiento paso a paso para la prueba de hipótesis. _RR_ = {| _Z_ | _> zα/_ 2 } (4.3) Si la prueba es unilateral, la región de rechazo se determina encontrando _zα_ tal que _P_ ( _Z > zα_ ) = _α_ o _P_ ( _Z < zα_ ) = _α_ y las regiones de rechazo serán _RR_ = { _Z > zα_ } = ( _zα ,_ ∞) o _RR_ = { _Z <_ − _zα_ } = (−∞ _,_ − _zα_ )_._ (4.4) Se desea probar al 95 % de certeza la hipótesis nula siguiente: Una población estadística normal tiene media cero, basándose en una muestra de tamaño _n_ = 9 y suponiendo _σ_ = 1, contra la alternativa de que la media es positiva. Solución Las hipótesis son _H_ 0 : _μ_ = 0 _Ha_ : _μ >_ 0 Se trata de una prueba unilateral derecha con 1 − _α_ = 0 _,_ 95 de donde _α_ = 0 _,_ 05. El estadístico de prueba es _Z_ = ( ¯ _x_ − _μ_ 0 ) _n σ_ ( ¯ _x_ − 0) = 3 ¯ _x_ ∼ _N_ (0 _,_ 1) La región de rechazo viene dada de _P_ ( _Z > zα_ ) = _α_ = 0 _,_ 05 de donde _zα_ = 1 _,_ 645. Si _Z >_ 1 _,_ 645 rechazamos la hipótesis nula _H_ 0 , esto equivale a _Z_ = 3 ¯ _x >_ 1 _,_ 645 ⇒ _x >_ ¯ Se tiene así, que la región de rechazo es _RR_ = { _x >_ ¯ 0 _,_ 5483 } Se afirma que los propietarios de automóviles deportivos conducen una media de 18. millas al año. Una firma de consumidores cree que el kilometraje promedio es probablemente más bajo. Para comprobarlo, la empresa de consumidores obtuvo información de 40 propieta- rios de automóviles deportivos seleccionados al azar que dio como resultado una muestra media de 17.463 millas con una desviación estándar de 1348 millas. ¿Qué podemos concluir 4.5 Pruebas de hipótesis para un solo parámetro 17 sobre esta afirmación? Utilice _α_ = 0 _,_ 01. ¿Cuál es el _p_ -valor? Solución Sea _μ_ la media real de la población. Tenemos las siguientes hipótesis _H_ 0 : _μ_ = 18000 _Ha_ : _μ <_ 18000 El estadístico observado (para _n >_ 30) es ### Z = ( ¯ _x_ − _μ_ 0 ) _n σ_ La región de rechazo unilateral izquierda es _RR_ = { _z <_ − _z_ 0 _,_ 01 } = { _z <_ − 2 _,_ 33 } Dado que _Z_ = − 2 _,_ 52 _<_ − 2 _,_ 33 = _Z_ 0 _,_ 01 , rechazamos la hipótesis nula con un nivel de confianza de (1 − 0 _,_ 01)100 % = 99 %. Existe suficiente evidencia para concluir que la media de millaje anual en autos deportivos es menor a 18.000. El _p_ -valor para esta prueba es _p_ − valor = _P_ ( _Z <_ − 2 _,_ 52) = 0 _,_ 0059 Este _p_ -valor es menor que _α_ = 0 _,_ 01, por lo que apoya la decisión de rechazar la hipótesis nula. El comando en R para realizar la prueba de hipótesis normal es z.test, de la librería “Tea- chingDemos”, la cual debemos instalar si aún no lo hemos hecho. Con este comando podemos realizar la prueba de hipótesis si tenemos los datos. Si no tenemos el conjunto de datos sino que solo tenemos los valores de la media _μ_ , la varianza _σ_^2 y el tamaño _n_ , entonces usamos las funciones one.sample.z y one.sample.t de la librería “asbio”. Una ventaja de estas funciones de “asbio” es que son capaces de funcionar tanto con datos en bruto, como con los valores de _n_ , ¯ _X_ y _s_. Instrucciones en R install.packages("asbio") library(asbio) # Datos mu0 = sd.ob = n= mu.ob = alpha =0. # Prueba de hipótesis one.sample.z(null.mu=mu0 , xbar = mu.ob , sigma=sd.ob , n=40, alternative = "less", conf = alpha) Si la varianza poblacional es desconocida Si no se conoce la varianza de la población, pero el tamaño de la muestra es mayor a 31, sabemos que _x_ ¯ se distribuye como un normal con media _μ_ y varianza _s_^2 , entonces utilizamos el estadístico de prueba 4.5 Pruebas de hipótesis para un solo parámetro 19 Instrucciones en R pollos=c(2.00 ,1.98 ,1.96 ,1.97 ,1.95 ,1.99 ,1.98 ,1.99 ,2.00 ,1.99) alpha =0. one.sample.z(pollos , null.mu = 1.97, sigma=sd(pollos), alternative = "less", conf = alpha) Note que en el código anterior, como la varianza es desconocida, cambiamos el valor de la desviación estándar por el valor de la cuasivarianza muestral dado por la función sd de R. 4.5.2 Pruebas de hipótesis con nivel _α_ para muestras pequeñas para _μ_ (Prueba _t_ ) Supongamos que _x_ 1 _, x_ 2 _,... , xn_ denota una muestra aleatoria de tamaño _n_ de una distribución normal con media desconocida _μ_ y varianza desconocida _σ_^2. Si _x_ ¯ y _s_^2 representan la media y varianza muestral respectivamente, y si _H_ 0 : _μ_ = _μ_ 0 es verdadera, entonces ### T = ( ¯ _x_ − _μ_ 0 ) _n s_ tiene distribución _t_ -de Student con _n_ − 1 grados de libertad. Como la distribución _t_ es simétrica por analogía con el caso de muestras grandes que utilizamos para la distribución normal se tiene _H_ 0 : _μ_ = _μ_ 0 _Ha_ : _μ_ , _μ_ 0 _,_ prueba bilateral _μ > μ_ 0 _,_ prueba unilateral derecha _μ < μ_ 0 _,_ prueba unilateral izquierda Estadístico de prueba: ### T = ( ¯ _x_ − _μ_ 0 ) _n s_ Región de rechazo: ### RR = | _t_ | _> tα/_ 2 ( _n_ − 1) _t > tα_ ( _n_ − 1) _t <_ − _tα_ ( _n_ − 1) El fabricante de cierto tipo de baterías anuncia que estas tienen una vida promedio de 2000 horas. Se desea probar esta hipótesis al nivel 95 % de confianza basándose en el hecho de que 10 baterías tomadas al azar tuvieron vidas de 2005 _,_ 1980 _,_ 1970 _,_ 2010 _,_ 1975 _,_ 2003 _,_ 1951 _,_ 2014 _,_ 1997 y 1950 horas. Calcular el _p_ -valor. Realice un boxplot y un gráfico de normalidad para estos datos. Solución Tenemos los siguientes datos _n_ = 10 _,_ 1 − _α_ = 0 _,_ 95 ⇒ _α_ = 0 _,_ 05 De la muestra se tiene _x_ ¯ = 1989 _,_ 5 y _s_^2 = 415 _,_ 833 Las hipótesis que nos planteamos son: _H_ 0 : _μ_ = 2000 _ha_ : _μ <_ 2000 Como el tamaño de la muestra es pequeño, el estadístico de prueba es el dado por (4.7), este es _T_ = ( ¯ _x_ − _μ_ 0 ) _n s_ La región de rechazo está dada por _RR_ = { _T <_ − _tα_ } Para _α_ = 0 _,_ 05 se tiene _t_ 0 _,_ 05 (9) = 1 _,_ 8331, luego _RR_ = { _T <_ − 1 _,_ 8331 } Se tiene que el estadístico _T_ cae fuera de la región de rechazo, ya que _T_ = − 1 _,_ 6282 _> t_ 0 _,_ 05 (9) = − 1 _,_ 8331, por lo que se acepta _H_ 0 , el _p_ -valor para esta prueba está dado por _P_ ( _T <_ − 1 _,_ 6282), que es un valor entre 0 _,_ 10 y 0 _,_ 05, de donde 0 _,_ 05 _< p_ − valor _<_ 0 _,_ 10 Tenemos así que _p_ -valor _> α_ , por lo que se acepta la hipótesis nula _H_ 0 de que la duración media de las baterías es de 2000 horas. Figura 4.2: Boxplot de la duración de las baterías