Prueba de hipotesis sobre la media con varianza desconocida
Prueba de Hipótesis
sobre la media
Alumna: Eva Karina Ruiz Ruiz
Asignatura: Estadística II
Varianza desconocida
Definición
Una prueba de hipótesis es una prueba estadística que se utiliza
para determinar si existe suficiente evidencia en una muestra de
datos para inferir que cierta condición es válida para toda la
población.
Por lo general, se considera que una hipótesis no puede probarse
como falsa o verdadera. Lo que se hace es apoyar un argumento a
partir de evidencias que surgen de investigaciones científicas. A
mayor cantidad de evidencias científicas, habrá mayores certezas
acerca de la condición de una hipótesis.
Una prueba de hipótesis examina dos hipótesis opuestas sobre
una población: la hipótesis nula y la hipótesis alternativa.
La hipótesis nula es el enunciado que se probará. Por lo
general, la hipótesis nula es un enunciado de que "no
hay efecto" o "no hay diferencia". La hipótesis alternativa
es el enunciado que se desea poder concluir que es
verdadero.
El nombre de nula indica que Ho, representa la hipótesis que
mantendremos a no ser que los datos indiquen su falsedad, y
puede entenderse, por tanto, en el sentido de neutra. La
hipótesis Ho, nunca se considera probada, aunque puede ser
rechazada por los datos.
Errores deTipo I y II
Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos
de errores: tipo I y tipo II. Los riesgos de estos dos errores están
inversamente relacionados y son determinados por el nivel de
significancia y la potencia de la prueba. Por lo tanto, usted debe
determinar qué error tiene consecuencias más graves para su situación
antes de definir sus riesgos.
Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se
basa en probabilidades, siempre existe la posibilidad de sacar una
conclusión incorrecta.
Error de Tipo I
Si rechaza la hipótesis nula cuando ésta es verdadera,
usted comete un error de tipo I. La probabilidad de
cometer un error de tipo I es α, que es el nivel de
significancia que usted establece para su prueba de
hipótesis. Un α de 0.05 indica que usted está dispuesto a
aceptar una probabilidad de 5% de que está equivocado
cuando rechaza la hipótesis nula. Para reducir este riesgo,
debe utilizar un valor más bajo para α. Sin embargo, si
utiliza un valor más bajo para alfa, significa que tendrá
menos probabilidades de detectar una diferencia
verdadera, si es que realmente existe.
Error de tipo II
Cuando la hipótesis nula es falsa y usted no la
rechaza, comete un error de tipo II. La
probabilidad de cometer un error de tipo II es β,
que depende de la potencia de la prueba. Puede
reducir su riesgo de cometer un error de tipo II al
asegurarse de que la prueba tenga suficiente
potencia. Para ello, asegúrese de que el tamaño
de la muestra sea lo suficientemente grande
como para detectar una diferencia práctica
cuando ésta realmente exista.
En resumen
La probabilidad de rechazar la hipótesis nula cuando es
falsa es igual a 1–β. Este valor es la potencia de la prueba.
Ejemplo de error Tipo I y Tipo II
Un investigador médico desea comparar la eficacia
de dos medicamentos. Las hipótesis nula y alterna
son:
Hipótesis nula (Ho): μ1= μ2
Los dos medicamentos tienen la misma eficacia.
Hipótesis alternativa (H1): μ1≠ μ2
Los dos medicamentos no tienen la misma eficacia.
Un error de tipo I se produce si el investigador rechaza la
hipótesis nula y concluye que los dos medicamentos son
diferentes cuando, en realidad, no lo son. Si los
medicamentos tienen la misma eficacia, el investigador
podría considerar que este error no es muy grave, porque de
todos modos los pacientes se beneficiarían con el mismo nivel
de eficacia independientemente del medicamento que
tomen.
Sin embargo, si se produce un error de tipo II, el investigador
no rechaza la hipótesis nula cuando debe rechazarla. Es decir,
el investigador concluye que los medicamentos son iguales
cuando en realidad son diferentes. Este error puede poner en
riesgo la vida de los pacientes si se pone en venta el
medicamento menos efectivo en lugar del medicamento más
efectivo.
¿Cuáles son algunas de las hipótesis
comunes?
Las hipótesis para determinar si una media de población,
μ, es igual a cierto valor objetivo μ0 incluyen las
siguientes:
H0: μ = μ0
H1: μ < μ0 (una prueba de cola inferior unilateral) o
H1: μ > μ0 (una prueba de cola superior) o
H1: μ ≠ μ0 (una prueba de dos colas o bilateral
Procedimiento general para la prueba de
Hipótesis
Establecer la hipótesis Ho y H1
Fijar un nivel de significancia α
Nivel de significancia (α): Probabilidad de rechazar la
hipótesis nula cuando es verdadera. Este nivel esta bajo el
control de la persona que realiza la prueba o la investigación
Definir el estadístico de prueba
Establecer la región de aceptación y rechazo
Calcular el valor que toma el estadístico de prueba de la
muestra seleccionada.
Decisión de aceptar o rechazar Ho en interpretar la
decisión tomada.
Prueba de Hipótesis de una media
Al realizar un contraste de hipótesis se puede tener
interés de investigar si la media poblacional es diferente, es
mayor o es menor que un valor que se ha fijado de antemano.
Para resolver estos problemas se plantean las siguientes
hipótesis:
Hipótesis bilateral: El nivel de significancia α se distribuye
uniformemente en ambos extremos de la distribución de
probabilidad, as α/2 en cada extremo y las hipótesis se
plantean así:
𝐻𝑜: 𝜇 = 𝜇0
𝐻1: 𝜇 ≠ 𝜇0
Hipotesis unilateral a la derecha. El valor de α se asigna en el
extremo derecho de la distribución y las hipótesis se plantean
así:
𝐻𝑜: 𝜇 = 𝜇0 𝜇 ≤ 𝜇0
𝐻1: 𝜇 > 𝜇0
Hipótesis unilateral a la izquierda. El valor de α se asigna en el
extremo izquierdo de la distribución y las hipótesis se plantean
así:
𝐻𝑜: 𝜇 = 𝜇0 𝜇 ≥ 𝜇0
𝐻1: 𝜇 < 𝜇0
Prueba de Hipótesis de una media
Caso 2: Cuando 𝜎2
es desconocida
Estadistico de prueba
𝑡𝑐 =
𝑥 − 𝜇 𝑜
𝑠/ 𝑛
Se desea probar la hipótesis alternativa bilateral
𝐻𝑜: 𝜇 = 𝜇0
𝐻1: 𝜇 ≠ 𝜇0
El cual tiene una distribución 𝑡 con 𝑛 − 1 grados de libertad si
la hipótesis nula 𝐻 𝑜: μ = μo es verdadera. Para probar la
Hipótesis nula, se calcula el valor del estadístico de prueba tc,
y se rechaza Ho si
𝑡 𝑐 > 𝑡 𝛼
2,𝑛−1
𝑡 𝑐 < −𝑡 𝛼
2,𝑛−1
Donde 𝑡 𝛼
2,𝑛−1 y −𝑡 𝛼
2,𝑛−1 son los puntos superior e inferior que
corresponden al porcentaje 100α/2 de la distribución 𝑡 con 𝑛 − 1 grados
de libertad.
Para la hipótesis alternativa unilateral
𝐻𝑜: 𝜇 = 𝜇0
𝐻1: 𝜇 > 𝜇0
Se calcula el estadístico de prueba 𝑡 𝑜 de la ecuación, y se rechaza Ho si
𝑡 𝑐 > 𝑡 𝛼
2,𝑛−1
Para la otra alternativa unilateral
𝐻0: 𝜇 = 𝜇0
𝐻1: 𝜇 < 𝜇0
Se rechaza si
𝑡 𝑐 < −𝑡 𝛼
2,𝑛−1
Ejemplo 1
La dirección medica de una clínica toma una
muestra aleatoria de 16 mediciones acerca del
tiempo de hospitalización, resultando una media
muestral de 5.4 días y una desviación estándar de
3.1 días. La dirección medica supone que el
promedio de tiempo de hospitalización es mayor de
5 días. Apoya esta información la hipótesis con un
nivel de significancia del 0.05.
Establecer la hipótesis Ho y H1
𝐻𝑜: 𝜇 = 5
𝐻1: 𝜇 > 5
Se calcula el estadístico de prueba 𝑡 𝑜 de la ecuación, y se rechaza
Ho si
𝑡 𝑐 > 𝑡0.05
2,15 =2.131
Calculando el estadístico tenemos
𝑥 = 5.4 𝑠 = 3.1 𝑛 = 16 𝜇 = 5
𝑡𝑐 =
5.4 − 5
3.1/ 16
= 0.5161
Conclusión: Dado que𝑡 𝑐=0.5161 < 𝑡0.05
2,15 =2.131, la hipótesis no se rechaza, a
lo que se concluye que, con un nivel de significancia de 0.05, no existe
suficiente evidencia de que el promedio de tiempo de hospitalización es mayor
de 5 días.
Ejemplo 2
• En su calidad de comprador comercial para un
supermercado, se toma una muestra aleatoria de doce (12)
sobres de cafe de una empacadora. Se encuentra que el
peso promedio del contenido de cafe de cada sobre es
15,97 grs. con una desviacion estandar de 0,15. La compañia
empacadora afirma que el peso promedio minimo del cafe
es de 16 grs. Por sobre. ¿Puede aceptarse esta afirmacion si
se asume un nivel de confianza del 90 por ciento?
Establecer la hipótesis Ho y H1
𝐻𝑜: 𝜇 ≥ 16
𝐻1: 𝜇 < 16
Se calcula el estadístico de prueba 𝑡 𝑜 de la ecuación, y se
rechaza Ho si
𝑡 𝑐 > 𝑡0.05,11 =-1.796
Calculando el estadístico tenemos
𝑥 = 15.97 𝑔𝑟 𝑠 = 0.15 𝑛 = 12 𝜇 = 16
𝑡𝑐 =
15.97 − 16
0.15/ 12
= −0.6928
Conclusión: Dado que𝑡 𝑐 = −0.6928 < 𝑡0.10
2,11 =-1.796, la hipótesis no
se rechaza, a lo que se concluye que, con un nivel de significancia de 0.10,
existe suficiente evidencia para afirmar que el peso promedio mínimo del
café es de 16 grs. por sobre.
Prueba de hipótesis para dos
medias.
Se tienen dos poblaciones y se toman muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 , se puede comparar
el comportamiento de dichas poblaciones a través de los
promedios. El estadístico de prueba depende del
conocimiento que se tenga de las varianzas.
Caso II: Varianzas desconocidas pero iguales.
Ahora se considerara la prueba de hipotesis de dos medias de dos
distribuciones normales cuando las varianzas son desconocidas. Se
empleara el estadstico t-Student para probar estas hipotesis. El estadistico
de prueba es el siguiente:
𝑇 =
𝑋 − 𝑌
𝑆 𝑝
1
𝑛1
+
1
𝑛2
~𝑡 𝑛1+𝑛2−2
Donde 𝑺 𝒑
𝟐 =
(𝒏 𝟏−𝟏)𝑺 𝟏
𝟐
+(𝒏 𝟐−𝟏)𝑺 𝟐
𝟐
𝒏 𝟏+𝒏 𝟐−𝟐
Si 𝐻𝑜: 𝜇1 = 𝜇2 es verdadera, 𝑇0 tiene una distribución 𝑡 𝛼
2,𝑛1+𝑛2−2. Si 𝑡0 es
el valor calculado del estadístico de prueba, entonces si
𝑡0 > 𝑡 𝛼
2,𝑛1+𝑛2−2
O si 𝑡0 > 𝑡 𝛼
2,𝑛1+𝑛2−2
Debe rechazarse 𝐻𝑜: 𝜇1 = 𝜇2
Las alternativas unilaterales se tratan de manera similar. Para probar
𝐻𝑜: 𝜇1 = 𝜇2
𝐻𝑜: 𝜇1 > 𝜇2
Se calcula el estadístico de prueba 𝑡0 y se rechaza 𝐻𝑜: 𝜇1 = 𝜇2 si
𝑡0 > 𝑡 𝛼
2,𝑛1+𝑛2−2
Para la otra hipótesis alternativa unilateral
𝐻𝑜: 𝜇1 = 𝜇2
𝐻𝑜: 𝜇1 < 𝜇2
Se calcula el estadístico de prueba 𝑡0 y se rechaza 𝐻𝑜: 𝜇1 = 𝜇2 si
𝑡0 < −𝑡 𝛼
2,𝑛1+𝑛2−2
La prueba 𝑡 para dos muestras dado en esta sección a menudo se le conoce
como prueba de t combinada, ya que las varianzas muéstrales se combinan
para estimar la varianza común. Además sus poblaciones normales son
independientes.
Ejemplo
Se analizan dos catalizadores para determinar la forma en que
afectan el rendimiento promedio de un proceso químico. De
manera específica, el catalizador 1 es el que se está empleando
en este momento, pero el catalizador también es aceptable.
Debido a que el catalizador es más económico, este puede
adoptarse siempre y cuando no cambie el rendimiento del
proceso. Se hace una prueba en una planta piloto; los
resultados obtenidos aparecen en la tabla. ¿Existe alguna
diferencia entre los rendimientos promedio? Utilícese α =
0.05.
La solución con el empleo de los pasos para la prueba de la hipótesis es:
Los parámetros de interés son ∶ 𝜇1 y 𝜇2, los cuales representan el
rendimiento promedio del proceso con los catalizadores 1 y 2,
respectivamente.
𝐻𝑜: 𝜇1 = 𝜇2
𝐻𝑜: 𝜇1 ≠ 𝜇2
α = 0.05
El estadístico de prueba es
𝑡 𝑐 =
𝑥 − 𝑦
𝑠 𝑝
1
𝑛1
+
1
𝑛2
Rechazar 𝐻𝑜 si 𝑡 𝑐 > 𝑡0.025,14 = 2.145 o si 𝑡 𝑐 < −𝑡0.025,14 = −2.145
Calcular estadístico. Dela tabla se tiene que 𝑥 = 92.255 𝑠1 = 2.39 𝑛1 = 8,
𝑦 = 92.733 𝑠2 = 2.98 𝑛2 = 8. Por consiguiente,
𝑆 𝑝
2
=
𝑛1 − 1 𝑆1
2
+ 𝑛2 − 1 𝑆2
2
𝑛1 + 𝑛2 − 2
=
7 2.39 2 + 7 2.98 2
8 + 8 − 2
= 7.30
𝑠 𝑝= 7.30 = 2.70
Y
𝑡 𝑐 =
𝑥 − 𝑦
𝑠 𝑝
1
𝑛1
+
1
𝑛2
=
92.255 − 92.733
2.70
1
8
+
1
8
= −0.35
Conclusión: dado que −2.145 < 𝑡 𝑐 = −0.35 < 2.145, no es posible rechazar
la hipótesis nula. Esto es, con un nivel de significancia de 0.05, no se tiene
evidencia suficiente que permita concluir que el catalizador 2 dará como
resultado un rendimiento promedio diferente del obtenido con el uso del
catalizador 1.
Caso 2: Varianzas
desconocidas y diferentes.
Si las varianzas son desconocidas y no se tiene
información para suponer que son iguales, entonces el
estadístico de prueba es el mismo que el utilizado
cuando las varianzas son iguales, pero los grados de
libertad de la distribución t-Student vienen dados por:
𝑔𝑙 =
𝑆1
2
𝑛1
+
𝑆2
2
𝑛2
2
𝑆1
2
𝑛1
2
𝑛1 + 1
+
𝑆2
2
𝑛2
2
𝑛2 + 1
− 2
Ejemplo:
Un fabricante de monitores prueba dos diseños de
microcircuitos para determinar si producen un flujo de
corriente equivalente. El departamento de ingeniería ha
obtenido los datos siguientes:
Con 𝛼 = 0.10 se desea determinar si existe alguna diferencia
significativa en el flujo de corriente promedio entre los dos
diseño, donde se supone que las dos poblaciones son
normales, pero no es posible suponer que las varianzas
desconocidas 𝜎1
2
y 𝜎2
2
sean iguales.
Diseño 1: 𝑛1 = 15 𝑥1 = 24.2 𝑆1
2
= 10
Diseño 2: 𝑛2 = 10 𝑥2 = 23.9 𝑆2
2
= 20
Al aplicar el procedimiento del contraste de hipótesis, se tiene lo siguiente:
Los parámetros de interés son los flujos de corriente promedio de los
circuitos diseños ∶ 𝜇1 y 𝜇2
𝐻𝑜: 𝜇1 = 𝜇2
𝐻𝑜: 𝜇1 ≠ 𝜇2
α = 0.10
El estadístico de prueba es
𝑡 𝑔𝑙 =
𝑥 − 𝑦
𝑆1
2
𝑛1
+
𝑆2
2
𝑛2
Los grados de libertad de 𝑡 𝑔𝑙 se obtienen con la ecuación
𝑔𝑙 =
𝑆1
2
𝑛1
+
𝑆2
2
𝑛2
2
𝑆1
2
𝑛1
2
𝑛1 + 1
+
𝑆2
2
𝑛2
2
𝑛2 + 1
− 2 =
10
15
+
20
10
2
10
15
2
16
+
20
10
2
11
− 2 = 16.17 ≈ 16
Por tanto, puesto que 𝛼 = 0.10, se rechaza 𝐻𝑜: 𝜇1 = 𝜇2 si 𝑡 𝑔𝑙 >
𝑡0.05,16 = 1.746 o si 𝑡 𝑔𝑙 < −𝑡0.05,16 = −1.746
Cálculos: al utilizar los datos contenidos en la muestra, se tiene que
𝑡 𝑔𝑙 =
𝑥 − 𝑦
𝑆1
2
𝑛1
+
𝑆2
2
𝑛2
=
24.2 − 23.9
10
15
+
20
10
= 0.18
Conclusiones:
Puesto que −1.746 < 0.18 < 1.746, no es posible rechazar 𝐻𝑜: 𝜇1 =
𝜇2 con el nivel de significancia 𝛼 = 0.10. Esto quiere decir que no hay
evidencia fuerte que indique que el flujo de corriente promedio de los
dos diseños sea diferente.