2. 1. Prueba de hipótesis para la proporción de una población y
Prueba de hipótesis para la media de una población.
2. Inferencias acerca de dos proporciones.
3. Inferencias acerca de dos medias independientes.
4. Inferencias de dos medias con muestras dependientes.
Contenido
3. Motivación
Se ha desarrollado un programa de
asistencia técnica para los productores
de maíz de la región Cajamarca.
Después de un año de su ejecución, la
coordinación desea evaluar el impacto
del programa.
La coordinación del programa formular las siguientes afirmaciones:
• El ingreso promedio de los productores, son mayores a S/. 1450
• Más del 65% de los productores han aumentado su rendimiento
• La variabilidad de tamaño de la mazorca es menor a 2.5 cm
¿Cómo se podría comprobar estas afirmaciones?
¿Hay un método estadístico para rechazar o aceptar dichas
afirmaciones?
4. Concepto de prueba de hipótesis
Una hipótesis estadística, es cualquier afirmación o suposición
que se hace acerca del tipo de distribución de probabilidad de la
población o al valor o valores de uno o más parámetros de la
población.
Tipo de hipótesis nula y alterna Hipótesis nula
(𝑯𝟎 o 𝑯𝒑 ). Es la hipótesis que es aceptada provisionalmente
como verdadera y cuya validez será sometida a verificación
experimental. Los resultados experimentales nos permitirán
seguir aceptándola como verdadera o si debemos rechazarla
como tal.
Hipótesis alterna (𝑯𝟏 o 𝑯𝒂). Es la hipótesis que se acepta en
caso de que la hipótesis nula sea rechazada. H1 es la suposición
contraria a H0.
5. Tipos de prueba de hipótesis
Se pueden formular hasta tres tipos de prueba, la cual dependerá de la forma de la
hipótesis alterna que se formule:
6. Prueba de hipótesis
𝒁 =
𝑋 − 𝝁
𝝈/ 𝒏
Recordar que para calcular los
valores críticos debemos usar
la fórmula Z:
Los valores críticos de Z, permiten
establecer una regla de decisión
que dice si se rechaza la hipótesis
nula o no
7. Tipo de errores
Error tipo I, es el error que se comete cuando se rechaza una
hipótesis nula que es verdadera en la población.
Error tipo II, es el error que se comete cuando se acepta una
hipótesis nula que es falsa en la población.
8. Procedimiento para la prueba de hipótesis
1. Formular las hipótesis. Plantear la hipótesis nula (Ho) y la alterna
(H1).
2. Elegir el nivel de significación (𝛼). Los valores comunes:0.01 a
0.05.
3. Seleccionar y calcular el estadístico para la prueba. Según el
parámetros a probar, se calcula el valor de la prueba estadística. (Z
calculado)
4. Determinar las regiones críticas. Se establece la región de
rechazo y de aceptación de la hipótesis nula (Ho) según el tipo de
prueba. Se busca el valor tabular usando la respectiva tabla estadística.
5. Decisión estadística. Se rechaza de la hipótesis nula (Ho), si Z
calculado cae en la región crítica de rechazo. En caso contrario, no
rechazar la hipótesis nula.
6. Conclusión. Indicar el nivel de significación y la conclusión
respectiva.
10. Prueba de dos colas para 𝝁
Se desea contrastar con un nivel de significancia del 5 % la hipótesis de que la talla media de los hombres de 18 o
más años de un país es igual a 180. Suponiendo que la desviación típica de las tallas en la población vale 4,
contraste dicha hipótesis frente a la alternativa de que es distinta.
Los datos constituyen una muestra de n=15 hombres seleccionados al azar, cuyas alturas son:
167 167 168 168 168 169 171 172 173 175 175 175 177 182 195
𝐻0: 𝜇 = 180
𝐻1: 𝜇 ≠ 180
Alternativa de decisión
Datos
𝜇 = 180
𝑋 = 173.47
𝜎 = 4
𝑛 = 15
𝑧 = ±1.96
𝑍𝑐 =
173.47 − 180
4/ 15
= −𝟔. 𝟑𝟐
El valor del estadístico de contraste está en la
zona de rechazo. Por lo que se rechaza la hipótesis
nula que establece una talla media igual a 180 cm
11. Prueba de dos colas para 𝝁: Ejercicio
El gerente de cuentas desea probar la hipótesis de que las cuentas tienen un promedio de S/ 312. Se selecciona
una muestra de 200 cuentas, dando una media de S/ 298.10 con s=S/ 97.30. Para minimizar la probabilidad de un
error de tipo I, se selecciona un nivel de significancia del 1%.
12. Prueba de una cola para 𝝁
En lugar de plantear una hipótesis que sea igual a la media poblacional, se puede plantear también que esta sea
mayor o menor que la media poblacional.
El calculo del valor de Z cambia:
Nivel de confianza
99%
Z(1 − 𝛼)
𝛼= 1- Nivel de confianza
𝛼= 1- 0.99 = 0.99 Z (0.9900) Z=2.33
13. Prueba de una cola para 𝝁
El Gerente de un Hotel reportó que el número promedio de habitaciones alquiladas por noche es por lo menos
212. Uno de los funcionarios corporativos considera que esta cifra puede estar sobre estimada. Una muestra de
150 noches produce una media de 201.3 habitaciones y una desviación estándar de 45.5 habitaciones. Si estos
resultados sugieren que el gerente ha inflado su reporte, será amonestado severamente. A un nivel de 1%, ¿Cuál
es el destino del gerente?
𝐻0: 𝜇 ≥ 212
𝐻1: 𝜇 < 212
Alternativa de decisión
Datos
𝜇 = 212
𝑋 = 201.3
𝜎 = 45.5
𝑛 = 150
𝑍𝑐 =
201.3 − 212
45.5/ 150
= −𝟐. 𝟖𝟖
Rechazo la hipótesis nula. El Gerente se ha
excedido en estimar su tasa de ocupación y será
amonestado severamente.
Z= −𝟐. 𝟑𝟑
15. Prueba de 𝝁, para muestras pequeñas
Al igual que en los intervalos de confianza, si la muestra es pequeña, 𝜎 es desconocida y la población es normal en
cuanto a su distribución, puede utilizarse una t-student.
𝐭 =
𝑋 − 𝝁
𝒔/ 𝒏
16. Prueba de 𝝁, para muestras pequeñas
Los estudiantes de una clase de estadística en la Universidad Continental, cuestionan la afirmación de que
McDonald´s coloca 0.25kg de carne en sus hamburguesas. Algunos estudiantes argumentan que en realidad se
utiliza más, mientras que otros insisten que es menos. Para probar la afirmación, cada estudiante compra una
hamburguesa y la lleva a clase, en donde la pesan en una balanza. Los resultados de la muestra son 𝑋 = 0.22𝑘𝑔 y
s=0.09. Si hay 25 estudiantes en clase, ¿a que conclusión llegarían a un nivel de significancia del 5%?
𝐻0: 𝜇 = 0.25
𝐻1: 𝜇 ≠ 0.25
Alternativa de decisión
Datos
𝜇 = 0.25
𝑋 = 0.22
𝜎 = 0.09
𝑛 = 25
𝑡 =
0.22 − 0.25
0.09/ 25
= 𝟏. 𝟔𝟔𝟕
El valor t, usa n-1 grados de libertad=24, entonces
𝒕𝟎.𝟎𝟓,𝟐𝟒 = 𝟐. 𝟎𝟔𝟒
La evidencia de prueba confirma la afirmación de Mc Donald´s de
que las hamburguesas de 0.25kg efectivamente contienen ese
peso en carne
17. Prueba de 𝝁, para muestras pequeñas
La gerencia financiera de una compañía desea evaluar la evolución de las ventas en el último trimestre. Para lo
cual extrae una muestra de 10 agentes registrando las ventas. El gerente financiero sospecha que las ventas
promedio por agente en el último trimestre son menores a las ventas programadas que fueron S/.465 mil. Pruebe
la afirmación del gerente financiero
18. Pruebas para 𝝅
𝒁 =
𝒑 − 𝝅
𝝈𝒑 𝝈𝒑 =
(𝝅)(𝟏 − 𝝅)
𝒏
Donde
El proceso de prueba de hipótesis para la proporción poblacional 𝝅 es muy similar a la de 𝜇. Un valor Z calculado a
partir de las muestra se compara con un valor crítico de Z con base en el valor 𝛼 seleccionado.
19. Pruebas para 𝝅
Del ejercicio anterior. La gerencia sabe que el 68% de los inmuebles vendidos en el trimestre anterior fueron para
parejas jóvenes. Pruebe la afirmación del gerente con un nivel de significación del 3%, que más del 68% de los
inmuebles vendidos en este trimestre fueron para parejas jóvenes. Si para una muestra aleatoria de 80 inmuebles
vendidos en este trimestre, 60 fueron adquiridos por parejas jóvenes.
𝐻0: 𝜋 ≤ 0.68
𝐻1: 𝜋 > 0.68
Alternativa de decisión
Datos
𝜋 = 0.68
𝑝 = 60/80
𝑛 = 80
𝑍𝑐 =
0.75 − 0.80
0.68(0.32)
80
= 𝟏. 𝟑𝟒
Con un nivel de significación de 3%, la proporción de inmuebles
vendidos a jóvenes en este trimestre no es mayor al 68%. La
afirmación del gerente es incorrecta
20. Pruebas para 𝝅: Ejercicio
El CEO de una gran firma manufacturera debe garantizar por lo menos 75% de sus empleados ha concluido un
curso avanzado de capacitación. De los 1200 empleados seleccionados aleatoriamente, 875 lo han hecho. El CEO
registra su asistencia para probar esta hipótesis. A un nivel de significancia del 5%, ¿Qué conclusiones incluye
usted en su reporte?
21. Pruebas para 𝝅: Ejercicio
Como director de operaciones de mercadeo para una cadena minorista, usted considera que el 60% de los clientes
de la firma se ha graduado de la universidad. Usted intenta establecer una importante política respecto a la
estructura de precios sobre esta proporción. Una muestra de 800 clientes revela que 492 clientes tienen grados
universitarios. A un nivel del 5%, ¿Qué puede concluir sobre la proporción de todos los clientes que se han
graduado de la universidad?
22. Pruebas cuando se tienen dos poblaciones
Ahora vamos a utilizar las herramientas aprendidas para comparar poblaciones. Vamos a construir una estimación
por intervalos de confianza para la diferencia entre dos media poblacionales o probar la hipótesis de que dos
medias poblaciones son iguales. Responderemos preguntas como: ¿Los trabajadores de una planta producen en
promedio más que los trabajadores de una segunda planta?
Las muestras para pruebas con dos poblaciones pueden ser:
Independientes
Dependientes
Se recolectan muestras independientes de cada población, incluso
las muestras no tienen que ser del mismo tamaño
La muestra de una población está relacionada con la muestra de
otra población
23. Estimación por intervalos en el caso de muestras
independientes.
A. Estimación con muestras grandes
Buscamos estimar la diferencia entre dos medias poblaciones (𝝁𝟏 − 𝝁𝟐). Esto depende de los tamaños de las
muestras ((𝒏𝟏 𝒚 𝒏𝟐). Aquí también debemos tomar en cuenta cuando las muestras son grandes o pequeñas.
24. Estimación por intervalos en el caso de muestras
independientes: Ejemplo
Una empresa transporta remesas entre Lima y Cusco por dos rutas. Una muestra de 100 camiones enviados por la
ruta del norte reveló un tiempo promedio de 17.2 horas con una desviación estándar de 5.3 horas, mientras que
75 camiones que utilizan la ruta del sur necesitaron un promedio de 19.4 horas con una desviación estándar de
4.5 horas. Se desea elaborar un intervalo de confianza del 95% para la diferencia en el tiempo promedio entre
estas dos rutas alternas.
𝑺𝑿𝒏−𝑿𝒔
=
(𝟓. 𝟑)𝟐
𝟏𝟎𝟎
+
(𝟒. 𝟓)𝟐
𝟕𝟓
= 𝟎. 𝟕𝟒𝟐
Debido a que la desviación estándar de la población son desconocidas, usamos lo siguiente:
Un valor de Z al 95% = 1.96
IC para (𝝁𝑵−𝝁𝑺) = (𝟏𝟕. 𝟐 − 𝟏𝟗. 𝟒) ± (𝟏. 𝟗𝟔)(𝟎. 𝟕𝟒𝟐)
−𝟑. 𝟕 ≤ (𝝁𝑵 − 𝝁𝑺) ≤ −𝟎. 𝟕𝟓
La empresa tiene un 95% de confianza que en la ruta del sur se toma entre 0.75 y 3.7 horas mas que en
la ruta del norte
27. Estimación por intervalos en el caso de muestras
independientes.
B. Estimación con muestras pequeñas
B.1. Cuando las varianzas 𝝈𝟏
𝟐
= 𝝈𝟐
𝟐
son iguales pero desconocidos
El intervalo de confianza para la diferencia entre las dos medias poblacionales se halla con una distribución t con
𝑛1 + 𝑛2 − 2 grados de libertad.
28. Estimación por intervalos en el caso de muestras
independientes.
B. Estimación con muestras pequeñas
B.2. Varianzas desiguales
29. Estimación por intervalos en el caso de muestras
independientes. Ejemplo
Una empresa describió dos programas de entrenamiento. Doce ejecutivos a quienes se les dio el primer tipo de
entrenamiento obtuvieron un promedio de 73.5 en la prueba de competencia. Aunque el artículo de noticias no
reportó la desviación estándar para estos 12 empleados, se asume que la varianza en los puntajes para este grupo
fue de 100.2. Quince ejecutivos a quienes se les administró el segundo programa de entrenamiento obtuvieron un
promedio de 79.8. Se asume una varianza de 121.2 para este segundo grupo. Haga un intervalo de confianza del
95% para la diferencia en los puntajes promedio para todos los ejecutivos que ingresaron a estos programas.
30. Estimación por intervalos en el caso de muestras
independientes. Ejemplo
En la cafetería de estudiantes, una maquina expendedora de bebidas dispensa bebidas en tazas de papel. Una
muestra de 15 tazas de una media de 15.3 onzas con una varianza de 3.5. Después de ajustar la máquina, una
muestra de 10 tazas produce un promedio de 17.1 onzas con una varianza de 3.9. Si se asume que 𝑠2 es constante
antes y después del ajuste, construya un intervalo de confianza del 95% para la diferencia entre los contenidos
promedios de llenado. Se asumen que las cantidades dispensadas están distribuidas normalmente.
31. Estimación por intervalos para la diferencia entre
proporciones
El procedimiento es similar, el error estándar de la diferencia entre dos proporciones muestrales (p1 – p2),
se estima mediante la fórmula:
32. Estimación por intervalos en el caso de muestras
dependientes.
Involucra un procedimiento en el cual varios pares de observaciones son muy parecidas en las dos
poblaciones analizadas, y solo se diferencian un solo aspecto.
Hay dos formas de como entender los ejercicios, a)dos grupos poblaciones idénticos donde solo hay un
factor que los diferencia y b) el mismo grupo analizado antes y después de algún evento.
33. Estimación por intervalos en el caso de muestras dependientes.
Una práctica común en las industrias es evaluar a los empleados en programas de capacitación, entonces se tiene
un puntaje antes y después de la capacitación en cada observación (empleado). Todo cambio en el puntaje puede
atribuirse a esta formación adicional. Para ilustrar los eventos se tiene los puntajes de 10 empleados antes y
después de habérselas impartido capacitación laboral adicional. Con un nivel de confianza del 90%
34. Estimación por intervalos en el caso de muestras dependientes.
𝒅 =
𝒅𝒊
𝒏
=
−𝟓. 𝟎
𝟏𝟎
= −𝟎. 𝟓
=
𝟕. 𝟑𝟖 − 𝟏𝟎(−𝟎. 𝟓)𝟐
𝟏𝟎 − 𝟏
= 𝟎. 𝟕𝟑𝟔
= 𝟏. 𝟖𝟑𝟑
𝒕(𝟎.𝟗,𝟗)
= −𝟎. 𝟓 ± (𝟏. 𝟖𝟑𝟑)
𝟎. 𝟕𝟑𝟔
𝟏𝟎
−𝟎. 𝟗𝟐𝟕 ≤ 𝝁 ≤ −𝟎. 𝟎𝟕𝟑
Se puede estar en un 90%
seguro que la media de los
puntajes posteriores al
entrenamiento está entre 0.073
y 0.927 mas alto que los
puntajes antes de la
capacitación
37. Prueba de hipótesis para dos medias con muestras
independientes
Pruebas con muestras grandes
Una empresa desea saber si el tiempo promedio que requieren los hombres para jugar los 18 hoyos es
diferente al de las mujeres. Se mide el tiempo de 50 partidos de hombres con una media de 3.5 y desviación
estándar de 0.9; y de 45 partidos de mujeres con una media de 4.9 y desviación estándar de 1.5 horas. Con
un nivel del 95% de confianza
RECORDAR
38. Pruebas con muestras grandes: Ejemplo
Que pasaría si se plantea como hipótesis que los hombres toman menos tiempo que las mujeres, como sería
la solución.
39. Prueba de hipótesis para dos medias con muestras
independientes
Pruebas con muestras pequeñas
RECORDAR
RECORDAR
40. Prueba de hipótesis para dos medias con muestras
independientes
Existe un desacuerdo considerable sobre el nivel de salario promedio de los trabajadores en dos empresas,
ya que los salarios fueron fijados en base a un antiguo acuerdo laboral. Como los salarios están controlados
se asume que la variación de salarios es la misma en ambas empresas. En la empresa 1 se extrae una
muestra de 23 trabajadores, media S/.17.53 por hora y varianza de 92.10, y para la empresa 2 se extrae una
muestra de 19 trabajadores, media S/.15.50 por hora y varianza de 87.10. Con un nivel de confianza del 98%
se quiere saber si la diferencia en salarios son iguales.
41. Prueba de hipótesis para dos medias con muestras
independientes
Una empresa vende dos tipos de amortiguadores para coches de bebés. Las pruebas de desgaste para medir
la durabilidad revelaron que 13 amortiguadores de tipo 1 duraron un promedio de 11.3 semanas, con una
desviación estándar de 3.5 semanas; mientras que 10 amortiguadores de tipo 2 duraron en promedio 7.5
semanas con una desviación estándar de 2.7 semanas. La empres puede tolerar una promedio de error de el
2%, la empresa desea probar que el promedio de ambos tipos de amortiguadores sean en promedio iguales.
No hay evidencia que sugiera que la varianza de la duración de los productos sean iguales.
43. Prueba de hipótesis para dos medias con muestras dependientes
Del ejercicio anterior. Se quiere evaluar si los puntajes en promedio antes y después de la capacitación son iguales
𝒅 =
𝒅𝒊
𝒏
=
−𝟓. 𝟎
𝟏𝟎
= −𝟎. 𝟓
=
𝟕. 𝟑𝟖 − 𝟏𝟎(−𝟎. 𝟓)𝟐
𝟏𝟎 − 𝟏
= 𝟎. 𝟕𝟑𝟔
45. Prueba de hipótesis para la diferencia entre proporciones
Un minorista desea probar la hipótesis de que la proporción de sus clientes masculino, quienes compran a
crédito, es igual a la proporción de mujeres que utilizan el crédito. Él selecciona 100 clientes hombres y
encuentra que 57 compraron a crédito mientras que 52 de las 110 mujeres lo hicieron. A un nivel del 1% de
significancia.