Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

PRUEBA DE HIPOTESIS I 2019-2 (3).pptx

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 35 Anuncio

Más Contenido Relacionado

Más reciente (20)

Anuncio

PRUEBA DE HIPOTESIS I 2019-2 (3).pptx

  1. 1. INFERENCIA ESTADISTICA PRUEBA DE HIPOTESIS Profesor: Kennedy Hurtado Ibarra. Licenciado en Matemática y Física Especialista en Estadística Aplicada Magister en Estadística Aplicada Doctor en Ciencias de la Educación Celular: 3002426058 Kennedyhurtado@dcc.uniatlantico.edu.co Referencia: Llinas Humberto, Estadística Inferencial. Canavo George, Probabilidad y Estadística Aplicaciones y Métodos. Montgomery Douglas. Probabilidad y Estadística para Ingeniería.
  2. 2. PRUEBA DE HIPOTESIS. • Introducción • Concepto de prueba de hipótesis • Error de tipo I y II • Prueba de hipótesis para la media. • Prueba de hipótesis para una proporción muestral. • Prueba de hipótesis de diferencia de dos proporciones muestrales. • Prueba de hipótesis de diferencia de medias. • Prueba de hipotesis para la varianza. • Prueba de hipótesis para la razón de varianza CONTENIDO PRUEBA DE HIPOTESIS
  3. 3. Objetivos del capitulo 1. Explicar el lenguaje de una prueba de hipótesis. 2. Estudiar los tipos de errores asociados con una prueba de hipótesis. 3. Aprender cuándo usar pruebas de una cola y cuándo pruebas de dos colas. 4. Realizar pruebas de hipótesis para la media, proporción, diferencia de dos medias, diferencia de dos proporciones, varianza y razón de dos varianzas.
  4. 4. Conceptos de la prueba de hipótesis En capítulos anteriores, hemos visto que la información obtenida a partir de muestras aleatorias sirve para estimar los parámetros desconocidos de la población mediante el cálculo de los estimadores puntuales o intervalos de confinaza. Por otro lado, en este capítulo, veremos que la información muestral también se puede utilizar para probar la validez de una afirmación, conjetura o hipótesis acerca del valor del parámetro de la población. Definición: Una hipótesis estadística es una afirmación cuantitativa acerca de una o más poblaciones, o mejor, como es más frecuente, afirmaciones sobre uno o más parámetros de una o más poblaciones.
  5. 5. Hipótesis nula y Alternativa. La hipótesis nula: Que se simboliza por 𝐻0 y que es la hipótesis que se debe comprobar. Es una afirmación en la que se dice que no hay diferencia alguna entre dos poblaciones, entre dos parámetros poblacionales o entre el valor verdadero de algún parámetro y su valor hipotético. La hipótesis alternativa: Simbolizada por 𝐻1, se establece como el “complemento” de la hipótesis nula y representa la conclusión que se apoya si la hipótesis nula se rechaza.
  6. 6. Errores de tipo I y de tipo II Generalmente se acostumbra discutir las decisiones con respecto a la hipótesis nula. Hay dos posibles decisiones: 1. Aceptar la hipótesis nula (o rechazar la alternativa). 2. Rechazar la hipótesis nula (o aceptar la alternativa). Definición: Error de Tipo I. Si rechazamos la hipótesis nula cuando en realidad es verdadera, hemos cometido un error; este evento lo llamamos un error de tipo I.
  7. 7. Definición: Error de Tipo II. Si aceptamos la hipótesis nula cuando es falsa, hemos cometido otro tipo de error; lo llamamos un error de tipo II. • P(error de tipo I) = P(rechazar 𝐻0/𝐻0 es verdadera) = α. • P(error de tipo II) = P(aceptar𝐻0/𝐻0 es falsa) = β. La probabilidad α se llama nivel de significancia, 1−α es el llamado grado de confianza y la probabilidad 1−β se llama potencia de la prueba.
  8. 8. Ejemplo: Suponga que un nuevo procedimiento y más caro para detectar el cáncer de mama en las mujeres se está probando para ver si es superior al método usado generalmente. Las hipótesis estadísticas son: 𝐻0: El nuevo método no es mejor que el comúnmente usado. 𝐻1: El nuevo método es mejor que el comúnmente usado. Obsérvese que las consecuencias de cometer un error de tipo I incrementarían los costos médicos. En cambio, las de cometer un error de tipo II serian una menor eficacia de la prueba y, posiblemente, una mayor proporción de muertes por cáncer.
  9. 9. EJEMPLO: Supongamos que un individuo es juzgado por cierto delito que supuestamente ha cometido. En este caso, las hipótesis a tener en cuenta son: 𝐻0: El individuo es inocente. 𝐻1: El individuo es culpable. Estadístico de prueba y región critica Dos “elementos” importantes que se deben tener en cuanta para realizar una prueba de hipótesis son el estadístico de prueba y la región crítica.
  10. 10. Definición: Un estadístico de prueba es una función que sólo depende de la información muestral que se utiliza para determinar si se rechaza, o no, la hipótesis nula. (es un valor que determina si aceptar o rechazar una hipótesis nula) La región crítica es el conjunto de todos los valores del estadístico de prueba para los cuales la hipótesis nula será rechazada. Entonces, la hipótesis nula será rechazada si y sólo si el valor observado o calculado del estadístico de prueba se ubica en la región de rechazo. El estadístico de prueba se determina teniendo en cuenta el parámetro sobre el cual se hace la hipótesis y la naturaleza de la distribución muestral del estadístico pertinente.
  11. 11. Ejemplo: Supongamos que, de una población distribuida normalmente con varianza 𝜎2 , se selecciona una muestra aleatoria simple de tamaño n, con media 𝑥 y varianza 𝑠2 . Además, supongamos que se quiere probar la hipótesis nula 𝐻0 : µ = µ0 , siendo µ0 un número real dado. (a)Si σ es conocida, el estadístico de prueba que se usa para verificar una hipótesis sobre la media poblacional es: z = 𝑥−µ σ 𝑛 el cual se distribuye como la distribución normal estándar. (b) Si σ es desconocida, entonces, bajo ciertas condicones, el estadístico de prueba que se usa para verificar una hipótesis sobre la media poblacional es: t = 𝑥−µ s 𝑛 El cual se distribuye como la distribución t de Student con n−1 grados de libertad.
  12. 12. PASOS PARA REALIZAR UN CONTRASTE DE HIPOTESIS • Determinar las hipotesis 𝐻0 :µ =µ0 , 𝐻0: µ ≥µ0 , 𝐻0 :µ ≤ µ0 . 𝐻1 :µ≠ µ0 , 𝐻1: µ <µ0 , 𝐻1 :µ > µ0 .
  13. 13. • Determinar el estadístico de prueba. z = 𝑥−µ σ 𝑛 , si la varianza poblacional σ2 es conocida Si n es ≥ 30. t = 𝑥−µ s 𝑛 , Si la varianza poblacional σ2es desconocida Si n es <30. Para la proporción el estadístico de prueba es: Z = 𝑝−𝑝0 𝑝0(1−𝑝0) 𝑛 Si n es ≥ 30 Si np ≥ 5 y n(1-p) ≥ 5
  14. 14. • Determinar el nivel de significancia α. • Toma de decisiones Z = (𝑥1 − 𝑥2 ) − 𝑑0 σ1 2 𝑛1 + σ2 2 𝑛2 t= (𝑥1 − 𝑥2 ) − 𝑑0 𝑠2 𝑛1 + 𝑠2 𝑛2 t= (𝑥1 − 𝑥2 ) − 𝑑0 𝑠2 𝑛1 + 𝑠2 𝑛2 𝛘2 = 𝑛 −1) 𝑠2 𝜎2 Z = 𝑝1 − 𝑝2 𝑝0(1 −𝑝0) 𝑛1 + 𝑝0 (1−𝑝0) 𝑛2 , Diferencia de proporciones
  15. 15. Prueba para la media Como se ha hecho anteriormente, nuevamente realizaremos el estudio de las pruebas de hipótesis para la media poblacional teniendo en cuenta dos casos: el caso de tener muestras grandes y el de tener muestras pequeñas. El caso de muestras grandes Cuando estemos considerando o bien una población normal (con cualquier tamaño de muestra) o bien una población de forma desconocida con muestras grandes (n ≥ 30) y bajo el supuesto de que la varianza poblacional es conocida o desconocida, aunque sea por razones distintas, los resultados son los mismos. En estos casos, la distribución muestral de la media muestral es la distribución normal. Para cualquiera de los tres casos siguientes que podemos considerar para la hipótesis nula : 𝐻0 :µ =µ0 , 𝐻0: µ ≥µ0 , 𝐻0 :µ ≤ µ0 .
  16. 16. Reglas de decisión para la prueba de µ (caso de muestras grandes). Tipo de hipótesis Regla de decisiones H0 : µ = µ0 Si Z ≥ Zα/2 o si Z ≤ -Zα/2; entonces, se H1 : µ ≠ µ0 Rechaza H0; de lo contrario, se acepta H0 Dos colas (Prueba bilateral) H0 : µ ≥ µ0 Si Z ≤ -Zα; entonces, H1 : µ < µ0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la izquierda (Prueba unilateral) H0 : µ ≤ µ0 Si Z ≥ Zα; entonces, H1 : µ > µ0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la derecha (Prueba Unilateral)
  17. 17. Teorema: Sea 𝑥 la media de una muestra aleatoria de tamaño n tomada de una población con media µ y varianza σ2 > 0. Supongamos que se cumple alguna de las siguientes condiciones: (a)La población es normal y σ2 es conocida (no importa el tamaño de n). (b) La población es normal, σ2 es desconocida y n ≥ 30. (c) La forma de la población es desconocida (o no normal), σ2 es conocida o desconocida y n ≥ 30. Entonces, una prueba de hipótesis con nivel de significancia α para la media µ es como se presenta en la anterior. siendo z = 𝑥−µ σ 𝑛 el estadístico de prueba correspondiente y 𝑍α/2el valor de una variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución normal.
  18. 18. Si la población es finita de tamaño N y el muestreo se hace sin reemplazo, se reemplaza σ 𝑛 por σ 𝑛 𝑁−𝑛 𝑁−1 . Además, en los casos en que la varianza sea desconocida y n ≥ 30, reemplazamos la desviación poblacional σ por la desviación muestral. Ejemplo: Como parte de un proceso de ensamblaje, se usa un taladro para hacer agujeros en una lámina de metal. Cuando el taladro funciona adecuadamente, los diámetros de estos agujeros tienen una distribución normal con media de 2 centímetros y desviación típica de 0,06 centímetros. Periódicamente, se miden los diámetros de una muestra aleatoria de agujeros para controlar que el taladro funciona adecuadamente. Asumamos que la desviación típica no varía. Una muestra aleatoria de nueve medidas da un diámetro medio de 1,95 centímetros. Probar la hipótesis de que la media poblacional es 2 centímetros frente a la alternativa de que no es así. Use un nivel de significancia de 0,05
  19. 19. SOLUCION: Sea µ el diámetro medio poblacional (en centímetros). Entonces, queremos contrastar la hipótesis: 𝐻0: µ = 2 𝐻1: µ ≠ 2. Tenemos que la población es normal con: σ = 0,06 (conocida), n = 9 𝑥= 1,95. Obsérvese que se cumple el supuesto (a). En este caso, µ0 = 2 y el valor del estadístico de prueba está dado por:
  20. 20. z= 𝑥−µ σ 𝑛 = z = 1,95−2 0,06 9 = -2,50 Para una prueba al nivel del 5%, tenemos que α = 0,05 y 𝑧α/2 =𝑧0,025 = 1,96. Entonces, como Z = −2,50 es menor que 𝑧α/2 = -1,96, se rechaza la hipótesis nula al nivel de significancia del 5%.
  21. 21. Ejercicio: Una muestra aleatoria de 100 muertes registradas en cierto país durante el año pasado mostró una vida promedio de 71,8 años. Suponiendo una desviación estándar poblacional de 8,9 años, ¿parecería esto indicar que la vida promedio hoy en día es mayor que 70 años? Utilice un nivel de significancia del 5%.
  22. 22. Caso de muestra pequeñas Reglas de decisión para la prueba de µ con muestras pequeñas: Tipo de hipótesis Regla de decisiones H0 : µ = µ0 Si t ≥ tα/2 o si t ≤ -tα/2; entonces, se H1 : µ ≠ µ0 Rechaza H0; de lo contrario, se acepta H0 Dos colas (Prueba bilateral) H0 : µ ≥ µ0 Si t ≤ -tα; entonces, H1 : µ < µ0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la izquierda (Prueba unilateral) H0 : µ ≤ µ0 Si t ≥ tα; entonces, H1 : µ > µ0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la derecha (Prueba Unilateral)
  23. 23. Teorema: Sea 𝑥 y 𝑠2 la media y la varianza de una muestra aleatoria de tamaño n < 30, tomada de una población con media µ y varianza σ2 desconocida. Entonces, una prueba de hipótesis con nivel de significancia α para la media µ es como se presenta en la tabla anterior. siendo t = 𝑥−µ s 𝑛 el estadístico de prueba correspondiente y 𝑡α/2el valor de una variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución . en la distribución t de Student con n−1 grados de libertad. Si la población es finita de tamaño N, se reemplaza 𝑠 𝑛 por 𝑠 𝑛 𝑁 −𝑛 𝑁−1 Es importar enfatizar que cuando la forma de la distribución de la población es desconocida o es no normal, entonces, no hay ningún método general para establecer una prueba de hipótesis para la media poblacional µ.
  24. 24. Ejemplo: Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9.Haga una prueba con nivel de 5% de significancia para determinar si el peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se distribuyen normalmente. Solución: µ = 14 libras H0 : µ = µ0 , H1 : µ ≠ µ0 S = 1,21 libras siendo t = 𝑥−µ s 𝑛 = 14,3−14 1,21 8 = 0,7012 𝑥 = 14,3 libras n = 8 α = 0,05 Como -2,365 ≤ 0,7012 ≤ 2,365, por lo tanto no se rechaza 𝐻0 y se concluye con un Nivel de significancia de 0,05 que el peso promedio de todos los bebés de seis meses es de 14 libras.
  25. 25. VALOR – P La elección del nivel de significación, tal y como se ha comentado anteriormente, es en cierta forma arbitraria. Sin embargo, una vez obtenida la muestra, se puede calcular una cantidad que permite resumir el resultado del experimento de manera objetiva. Definición. El valor p es el nivel de significancia más pequeño posible que conduce al rechazo de la hipótesis nula 𝐻0. Definición de nivel de significancia. El nivel de significación es el riesgo o la probabilidad que voluntariamente asume el investigador de equivocarse al rechazar la hipótesis nula, cuando en realidad es cierta. Este riesgo se establece normalmente en 0.10 (90%); 0.05 (95%) ó 0.01 (99%).  Si p < 0.05 se considera significativo, en cuyo caso se rechaza la hipótesis nula  Si p> 0.05 se considera no significativo en cuyo caso no se rechaza la hipótesis nula.
  26. 26. Consideraciones: • Se rechaza la hipótesis nula si el valor p asociado al resultado observado es igual o menor que el nivel de significación establecido, convencionalmente 0,10; 0,05 ó 0,01. • El valor p puede considerarse como el nivel de significancia α más pequeño para el que los datos sean significativos. Para las pruebas de distribuciones normales, es relativamente sencillo calcular el valor p. Si z es el valor calculado del estadístico de prueba, entonces el valor p es: 1° 2 1 − ᶲ( 𝑧 ) para una prueba de dos cola H0 : µ = µ0 H1 : µ ≠ µ0 2° 1- ᶲ(z) para una prueba de cola superior H0 : µ ≤ µ0 H1 : µ > µ0 3° ᶲ(z) para una prueba de cola inferior H0 : µ ≥ µ0 H1 : µ < µ0
  27. 27. EJEMPLO: si el valor calculado de z = 3,25 y supongamos que el tipo de hipótesis es de dos cola , el valor p es: Valor-P = 2 1 − ᶲ( 𝑧 ) = 2 1 − ᶲ(3,25) = 0,0012 Por tanto H0 : µ = µ0 se rechaza con cualquier nivel de significancia α ≥ p = 0,0012 Entonces la hipótesis nula 𝐻0 será rechazada si α = 0,01, pero no será rechazada si α = 0,001. EJEMPLO: El espesor objetivo de obleas de silicio utilizadas en cierto tipo de circuito integrado es de 245 m. De una muestra de 50 obleas, cada una con un espesor determinado, se obtiene una media de espesor de 246.18 m y una desviación estándar de 3.60 m. ¿Sugieren estos datos que el espesor de oblea promedio verdadero es algún otro diferente del valor objetivo. H0 : µ = 245 H1 : µ ≠ 245 z = 𝑥−µ σ 𝑛 = 246,18−245 3,60 50 =2,32 Determinación del valor P: Como la prueba es de dos colas, Valor P = 2(1 -ᶲ(2.32)) = 0.0204 CONCLUSION: Con un nivel significativo de 0.01, 𝐻0 no sería rechazada puesto que 0.0204 > 0.01. A este nivel de significación, existe suficiente evidencia para concluir que el espesor promedio verdadero difiere del valor objetivo.
  28. 28. Pruebas para la proporción En muchos problemas prácticos, queremos probar hipótesis sobre la proporción p de elementos de una población que poseen cierto atributo. Reglas de decisión para la prueba de p (caso de muestras grandes). Tipo de hipótesis Regla de decisiones H0 : p = p0 Si Z ≥ Zα/2 o si Z ≤ -Zα/2; entonces, se H1 : p ≠ p0 Rechaza H0; de lo contrario, se acepta H0 Dos colas (Prueba bilateral) H0 : p ≥ p0 Si Z ≤ -Zα; entonces, H1 : p < p0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la izquierda (Prueba unilateral) H0 : p ≤ p0 Si Z ≥ Zα; entonces, H1 : p > p0 se Rechaza H0; de lo contrario, se acepta H0 Cola a la derecha (Prueba Unilateral)
  29. 29. Teorema: Sea 𝑝 la proporción de éxitos en una muestra aleatoria de tamaño n, procedente de un población con proporción p éxitos. Supongamos que se cumple alguna de las dos siguientes condiciones: (a) n ≥ 30; (b) np ≥ 5 y n(1−p) ≥ 5. Entonces, una prueba de hipótesis con nivel de significancia α para la proporción p es como se presenta en la tabla. siendo Z = 𝑝−𝑝0 𝑝0(1−𝑝0) 𝑛 , el estadístico de prueba correspondiente y 𝑍α/2 el valor de una variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución normal. Para el caso de una población finita de tamaño N, debemos reemplazar 𝑝0(1−𝑝0) 𝑛 por la cantidad 𝑝0(1−𝑝0) 𝑛 𝑁−𝑛 𝑁−1
  30. 30. Ejemplo: De una muestra aleatoria de 802 clientes de supermercados, suponga que 378 pagaron sus artículos con tarjetas de crédito. Contrastar el nivel del 10%, la hipótesis nula de que al menos la mitad de los compradores pagan sus artículos con tarjetas de crédito frente a la alternativa de que la proporción poblacional es menor de la mitad. SOLUCION: Sea 𝑃 la proporción poblacional de compradores que pagan sus artículos con tarjetas de crédito. Queremos probar la hipótesis 𝐻0 : p ≥ 0,50 versus : 𝐻1: 𝑝 < 0,50
  31. 31. Obsérvese que puede aplicar el teorema, porque el supuesto (a) del teorema se cumple. En este caso, el valor del estadístico de prueba esta´ dado por 𝑝= 378 802 = 0,471 Z = 𝑝−𝑝0 𝑝0(1−𝑝0) 𝑛 = 0,471−0,50 0,50 (0,50) 802 = -1,64 Para una prueba al nivel del 10%, tenemos que α = 0,10 y Zα = 𝑍0,10 = 1,28. Entonces, como Z = −1,64 es menor que −Zα = −1,28, se rechaza la hipótesis nula al nivel de significancia del 10%.
  32. 32. Ejercicio: Un doctor afirma que el 12% de todas las citas son canceladas, durante un periodo de seis semanas, fueron canceladas 21 de las 200 citas del doctor. Haga una prueba con un nivel de significancia del 5% para determinar si la verdadera proporción de todas las citas que son canceladas es diferente del 12%.
  33. 33. Prueba para la diferencia de dos proporciones Volvamos sobre el problema de comparación de dos proporciones poblacionales. Teorema: Sea 𝑃1 la proporción de éxitos observada en una muestra aleatoria de tamaño 𝑛1, procedente de una población con proporción 𝑃1 de éxitos, y sea 𝑝2 la proporción de éxitos observada en una muestra aleatoria independiente de tamaño 𝑛2, procedente de una población con proporción de éxitos 𝑃2 . Supongamos que se cumple alguna de las siguientes dos condiciones: (a) 𝑛1 ≥ 30 y 𝑛2 ≥ 30; (b) 𝑛1 𝑝1≥ 5, 𝑛1(1−𝑝1) ≥ 5, 𝑛2𝑝2 ≥ 5 y 𝑛2(1−𝑝2) ≥ 5. Entonces, una prueba de hipótesis con nivel de significancia α para la diferencia de proporciones 𝑝1 - 𝑝2 es como se presenta en la tabla, siendo:

×