Este documento presenta información sobre pruebas de hipótesis cuantitativas. Explica diferentes tipos de pruebas de hipótesis como pruebas de una cola y dos colas, y cómo seleccionar el tipo apropiado dependiendo de la formulación de las hipótesis nula y alternativa. También cubre cálculos estadísticos como el estadístico Z y t de Student, y valores críticos. Finalmente, incluye ejemplos para ilustrar los conceptos.
2. 2
PUNTOS A TRATAR
Sesión 8a: TEST DE HIPÓTESIS (II/II)
Prueba a una cola.
Prueba con muestras pequeñas.
Prueba para la proporción.
Ejercicios.
Pruebas T de muestras independientes.
Pruebas T pareada.
3. 3
TEST DE HIPÓTESIS
La hipótesis se formula sobre un parámetro de la
población y las conclusiones sobre el rechazo o no de
esta hipótesis se basan en la información muestral.
Muestra aleatoria proporciona evidencias que
permiten rechazar o no rechazar la hipótesis nula.
Si la evidencia de la muestra es inconsistente con la
hipótesis planteada Se rechaza la H0
Si la evidencia de la muestra es consistente y apoya la
hipótesis planteada No se rechaza la H0.
4. 4
DETALLES ACERCA DE H0 Y H1
La H0 siempre incluirá el signo igual: “=”, “≥”, “≤”.
La H1 no contiene el signo = y contendrá: “≠” “<” y “>”.
Para µ se puede tener:
“En promedio, el contenido de cada bolsita de cereal
de maca pesa 150 gramos”.
H0 : µ=150 H1 : µ ≠ 150 Test Bilateral
“En promedio, el contenido de cada bolsita de cereal
de maca es al menos de 150 gramos”.
H0 : µ ≥150 H1 : µ < 150 Test Unilateral
5. 5
recordando… PASOS PARA PROBAR UNA HIPÓTESIS
Plantear
H0 e H1
Paso 1
Seleccionar
el nivel
Paso 2
Calcular el valor
del estadístico
de prueba
Paso 3
Formular regla
para tomar
decisión
Paso 4
Tomar una
decisión
Paso 5
No se
rechaza H0
Se rechaza
H0 y “se
acepta” H1
6. 6
PRUEBA DE HIPÓTESIS BILATERAL
(DE DOS COLAS)
Una prueba de dos colas: Tiene una zona de rechazo
en ambas colas de la distribución: /2 a cada lado.
150 gramos
Valores críticos (=Zα/2)
H0: µ = 150
H1: µ ≠ 150
P<0.05 (video)P<0.05
7. 7
PRUEBA DE HIPÓTESIS UNILATERAL
DE UNA COLA: A LA IZQUIERDA
Prueba de una cola: Zona de rechazo sólo en una de las
colas de la distribución: Cola izquierda o inferior.
Valor crítico (=Zα)
H0: µ150
H1: µ<150 Indica una sola dirección: La media poblacional es < 150.
0 Escala de ZP<0.05
8. 8
PRUEBA DE HIPÓTESIS UNILATERAL
DE UNA COLA: A LA DERECHA
Prueba de una cola: Zona de rechazo sólo en una de las
colas de la distribución: Cola derecha o superior.
Valor crítico (=Zα)
H0: µ 5
H1: µ > 5 Indica una sola dirección: La media poblacional es > 5.
0 Escala de Z
P<0.05
9. 9
PRUEBA DE UNA COLA O DE DOS COLAS
(¿CÓMO SABER CUÁL USAR?)
Palabras
Símbolo de
desigualdad
Parte
de:
Más grande (o más) qué > H1
Más pequeño (o menor) < H1
Ha incrementado > H1
No más que H0
Cuando menos ≥ H0
¿Existe una diferencia? ≠ H1
No ha cambiado = H0
10. 10
De acuerdo con la Coffee Research el bebedor estadounidense
habitual de café consume 3.1 tazas al día. Una muestra de 12
personas de la tercera edad reveló que el día de ayer
consumieron las siguientes cantidades de café, expresadas en
tazas: 3.1, 3.3, 2.6, 2.6, 4.3, 4.4, 3.8, 3.1, 4.1, 3.1, 3.2, 3.2. Los
datos sugieren que existe una diferencia entre el promedio
nacional y la media tomada de las personas de la 3era edad,
con un nivel de significancia….
Problema de Prueba de Dos Colas
Paso 1: Se establecen las hipótesis nula y alternativa
H0: = 3.1 H1: ≠ 3.1
¿CÓMO ESCOGER UNA HIPÓTESIS A PARTIR DE
UN PROBLEMA?
11. 11
De acuerdo con una encuesta reciente, los tacneños
duermen un promedio de 7 horas o más por noche. Una
muestra de 50 estudiantes tacneños reveló que la cantidad
media de horas dormidas la noche anterior fue de 6 horas,
48 minutos (6.8 horas). La desviación estándar de la
muestra fue de 0.9 horas ¿Es razonable concluir que los
estudiantes tacneños duermen menos que el tacneño
normal? Utilice un nivel de significancia del 0.05
Problema de Prueba de Una Cola
Paso 1: Se establecen las hipótesis nula y alternativa
H0: ≥ 7 H1: < 7
¿CÓMO ESCOGER UNA HIPÓTESIS A PARTIR DE
UN PROBLEMA?
12. 12
En el momento en que Lolo fue contratado como mozo en
“La Mar” se le dijo: “Puedes ganar a lo más un promedio de
S/. 200 al día de propinas” Suponga que la desviación
estándar de la población es S/. 10. Los primeros 35 días de
trabajar en “La Mar”, la suma media fue de S/. 220 ¿Puede
Lolo concluir que está ganando un promedio de más de 200
en propinas? Utilice un nivel de significancia del 0.01 .
Problema de Prueba de Una Cola
Paso 1: Se establecen las hipótesis nula y alternativa
H0: ≤ 200 H1: > 200
¿CÓMO ESCOGER UNA HIPÓTESIS A PARTIR DE
UN PROBLEMA?
13. 13
VALORES CRÍTICOS (VC):
DOS COLAS Vs UNA COLA
Valores Críticos: Definen las fronteras de la región de rechazo y
no rechazo. Dependen de:
Nivel de significancia: α (1%, 5%, 10%)
La distribución de probabilidad del estadístico de prueba (Z ó t)
El tipo de Prueba de Hipótesis (bilateral o unilateral).
NOTE: VC para un test de una cola difieren de los VC de un
test de dos colas, con el mismo nivel de significancia .
Valor α Zα/2 Área Zα Área
0.01 2.58 0.495 2.33 0.49
0.05 1.96 0.475 1.65 0.45
0.1 1.65 0.45 1.28 0.4
Dos colas Una cola
15. 15
EJERCICIO 1
1. En una reunión el Jefe de producción de una empresa
reportó que el número promedio de unidades producidas por
día es de por lo menos 212. Es decir, µ 212.
Su Gerente considera que esta cifra puede estar “inflada” y si
ese fuese el caso el Jefe será amonestado. Con una muestra
de 150 días se encuentra una media de 201.3 unidades
producidas y una desviación estándar de 45.5 unidades. A un
nivel de 5% ¿Qué sucederá con el funcionario?.
1er paso: Definir las hipótesis: H0: µ212 H1: µ < 212
2do paso: Como =0.05 a una cola valor crítico Z0.05=1.65.
3er paso: Calcular el estadístico de prueba.
201.3 - 212
Zest= ----------------- Zest = -2.88
45.5 / 150
16. 16
EJERCICIO 1
4to paso: Regla de decisión: No rechazar H0 si Zest -1.65.
Rechazar H0 si Zest< -1.65.
Valor crítico (=Z0.05)
Unidades
producidas
0.450.05
-1.65
Zona de rechazo
de la H0.
Zona de acepta-
ción de la H0
5) Tomar una decisión: Zest= -2.88 Se rechaza H0, la
muestra da suficiente evidencia para rechazar H0, no se puede
aceptar que el promedio de producción diaria es 212.
El jefe será amonestado.
Z estimado
17. 17
EJERCICIO 2
2. Un centro Comercial emite su propia tarjeta de crédito. A
Mary, la nueva gerente de crédito, le han dicho que la
media mensual de saldos no pagados por los clientes es
menor que S/.400 con una desviación estándar poblacional
de S/. 38. Pero ella desconfía por lo que realiza una
revisión al azar de 170 saldos de clientes, encontrando una
media muestral de S/407.
¿Debe Mary concluir, a un nivel de significancia de 0.05,
que la media de la población es mayor que S/.400, o es
razonable suponer que la diferencia de S/.7 se debe al
azar?
18. 18
EJERCICIO 2
1er paso: Definir las hipótesis:
H0: µ ≤ 400 H1: µ > 400
3er paso: Calcular el valor estadístico de prueba.
407 - 400
Zest= ----------------- Zest = 2.40
38 / 170
4to paso: Formular la regla de decisión, definir la región
de rechazo y la de no rechazo de la H0.
2do paso: Seleccionar nivel =0.05 Z0.05=1.65
19. 19
EJERCICIO 2
5to paso: Tomar una decisión:
Criterio 1: Dado que Zest= 2.4>1.65, se rechaza la H0, ó
Criterio 2: Dado que P<0.05, se rechaza la H0.
Z0 1.65
2.4
α=0.05
P<0.05
Zona de rechazo
de la H0.
20. 20
PRUEBAS DE HIPÓTESIS PARA MUESTRAS
PEQUEÑAS
Se emplea la distribución t de Student: t como valor
estadístico de prueba.
En general la t se emplea cuando:
la muestra es pequeña.
es desconocida Se emplea s.
la población es normal o casi normal.
El estadístico t se calcula como: _ _
X - µ = X - µ
s_ s/ n
x
t =
21. 21
3. Una empresa que brinda el servicio de lavandería ha estimado
que el gasto promedio mensual de una familia en este servicio
es por lo menos S/. 90, el gerente desea verificar esto pues esa
información la usará en sus proyecciones de ingresos para el
próximo año. Seleccionó una muestra de 23 recibos y encontró
que la media era S/. 86 con una desviación estandar de S/10.
¿Se puede concluir que la diferencia de S/. 4 entre la media
muestral y la poblacional puede atribuirse al azar?.
EJERCICIO 3
1° Definir las Hipótesis: H0: µ 90 H1: µ < 90
2° Seleccionar = 5%.
3° Estadístico de Prueba: No se conoce y n=23 < 30:
t = 86 - 90
10/23
= -1.92
_
X - µ =
s/ n
22. 22
EJERCICIO 3
5° Dado que test= -1.92 < -1.717, Hay evidencias para
rechazar la H0.
t
0
-1.717
-1.92
Zona de rechazo
de la H0.
Zona de acepta-
ción de la H0
4° Formular la regla de decisión:
Aceptar la H0 si test > t0.05
22 g.l.= -1.717
Rechazar la H0 si test < t0.05
22 g.l.= -1.717
24. 24
n > 30 Distribución Normal Distribución Normal
tabla Z tabla Z
n < 30 y se Distribución Normal Distribución t
Supone dist N tabla Z tabla t
o casi N
¿QUÉ DISTRIBUCIÓN EMPLEAR?
Cuando se conoce Cuando no se conoce
poblacional poblacional
25. 25
PRUEBAS PARA LA MEDIA DE LA POBLACIÓN ()
H0: µ= valor H0: µ valor H0: µ valor
H1: µ valor H1: µ< valor H1: µ> valor
Rechazar H0 si: Rechazar H0 si: Rechazar H0 si:
|Z| > Z/2 Z < -Z Z > Z
|t| > t/2,n-1 t < - t,n-1 t > t,n-1
_
X - µ
s/ n
t =
_
X - µ
/ n
Z =
27. 27
PRUEBA DE HIPÓTESIS SOBRE PROPORCIONES
1) Plantear H0 y H1
H0: La cantidad de mujeres que ingresa al mercado de trabajo es
el 60%
H1: La cantidad de mujeres que ingresa al mercado de trabajo NO
es el 60%
2) Seleccionar el nivel de significancia ().
3) Calcular el valor estadístico de prueba. Estadístico de
prueba Z será: (p – P) P=Proporción en población
Z= --------------- p= proporción en muestra
P(1-P)/n
4) Formular la regla de decisión: Valor crítico, región de
rechazo y región de aceptación de la H0.
5) Tomar una decisión.
28. 28
4.En el pasado, a lo más el 15% de la propaganda para
recolectar donativos dio como resultado contribuciones para
una Fundación. Si se emplea ahora el marketing digital
usando Facebook se analizó una muestra de 200 personas de
las cuales 45 enviaron un donativo. Para un nivel de 0.05 de
significancia, ¿se puede concluir que la nueva estrategia
de marketing fue más eficaz?
Ejercicio 4
1° Definir las Hipótesis: H0: P ≤ 0.15 H1: P >0.15
2° Seleccionar = 5% Valor crítico = 1.65
3° Estadístico de Prueba: P=Proporción en la población
p=Proporción en la muestra45
200
p = = 0.225
Z= (p–P)/ P(1-P)/n Z= = 2.97=
(0.225–0.15)
0.15*0.85/200
(0.075)
0.02525
29. 29
Ejercicio 4
4° Formular la regla de decisión: Rechazar la H0 si el
valor de Zest > 1.65.
Z1.65
0.05
Rechazo
2.97
5° Decidir: Rechazar la H0 porque Zest > 1.65
30. 30
Hipótesis sobre un parámetro poblacional. Es lo primero
que se plantea, no se plantea después de observar los
datos. Puede ser Test sobre µ ó sobre P ó sobre 2
Nula (H0) ^ Alternativa (H1)
Las hipótesis nula y alternativa no tienen el mismo papel:
H0 : Hipótesis científicamente más simple.
H1 : El peso de la prueba recae en ella.
Nivel de significancia α debería ser pequeño.
α= Probabilidad de error de tipo I (Rechazar H0 cuando
es V)
Tipos de error: Tipo I y Tipo II.
RESUMEN: ¿Qué hemos visto?
31. 31
Rechazar una hipótesis no prueba que sea falsa. Se puede
cometer error de tipo I.
No rechazar una hipótesis no prueba que sea cierta. Se
puede cometer error de tipo II.
Si decidimos rechazar una hipótesis debemos mostrar la
probabilidad de equivocarnos.
Prueba bilateral o 2 colas: H0: µ = 20 ^ H1: µ ≠ 20
Prueba unilateral o 1 sola cola: H1: µ < 20
Muestras grandes: Usar la Z como estadístico de prueba.
Muestras pequeñas y desconocida: Usar la t.
RESUMEN: ¿Qué hemos visto?
32. 32
Anderson, D., Sweeney, D. y Williams T. (2008). Cap 9.
Levin, R. y Rubin, D. (2010). Cap. 8
BIBLIOGRAFIA
35. 35
PRUEBAS T
La elección de la prueba T a utilizar dependerá
exclusivamente de las muestras a comparar.
Busca encontrar diferencias entre las medias de dos
muestras
Prueba T de muestras independientes: Se utiliza
cuando dos grupos tienen condiciones diferentes. Es
decir, las muestras son fuentes de variabilidad. Eg.
Hombres vs Mujeres, niños vs adultos, Latinos vs
Europeos, etc.
Prueba T pareada: Se utiliza cuando dos grupos tienen
condiciones iguales. En este caso la muestra NO es
fuente de variabilidad. EG. Promedio de los alumnos
antes del parcial vs después del parcial, Km promedio de
caminata de una persona en día de semana vs fines de
semana, etc.
36. 36
PRUEBAS T
Para poder aplicar una prueba T, se deben cumplir ciertos
supuestos, de los cuales, los más importantes son:
◦ Normalidad de las diferencias: La diferencia de las
observaciones de ambas muestras deben cumplir
normalidad
◦ Homocedasticidad: Las varianzas de ambos grupos
deben ser iguales
37. 37
PRUEBA T DE MUESTRAS INDEPENDIENTES
El estadístico T se calcula de la siguiente manera:
La cual puede convertirse en:
Hallando el valor de S2
p:
𝑡 =
𝑋1 − 𝑋2 − (𝜇1 − 𝜇2)
𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑒 𝑜𝑓 𝑡ℎ𝑒 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑒𝑟𝑟𝑜𝑟
𝑡 =
𝑋1 − 𝑋2
𝑆 𝑝
2
𝑛1
+
𝑆 𝑝
2
𝑛2
𝑆 𝑝
2 =
𝑛1 − 1 𝑆1
2
+ (𝑛2 − 1)𝑆2
2
𝑛1 + 𝑛2 − 2
38. 38
PRUEBA T DE MUESTRAS INDEPENDIENTES
Por ejemplo en el siguiente caso:
◦ Durante el ciclo 2017-2 , se observó la estatura
promedio de los hombres y mujeres que llevaban el
curso de metodología de la investigación cuantitativa y
se halló lo siguiente:
Estatura (x) Desviación
estándar
Cantidad
Mujeres (x1) 165 3.1 124
Hombres (x2) 173 3.9 76
39. 39
PRUEBA T DE MUESTRAS INDEPENDIENTES
Primero, bajo el supuesto que los hombres son en promedio
5cm más altos que las mujeres, planteamos las hipótesis:
◦ H0: x2-x1-5=0
◦ H1: x2-x1-5 no es igual a 0
A 95% de confianza, el valor T (76+124-2 gl) es igual a 1.972
Reemplazando en la formula, hallamos primero el S2
p
𝑆 𝑝
2
=
124 − 1 ∗ 3.12 + 76 − 1 ∗ 3.92
124 + 76 − 2
𝑆 𝑝
2 =11.73
40. 40
PRUEBA T DE MUESTRAS INDEPENDIENTES
Continuamos reemplazando en las fórmulas:
𝑡 =
173 − 165 − 5
11.73
76
+
11.73
124
𝑡 =6.01
41. 41
PRUEBA T DE MUESTRAS INDEPENDIENTES
Como 6.01 es mayor que 1.972, podemos concluir que la
diferencia de estaturas de ambos sexos es diferente de 5cm.
0.4
0.3
0.2
0.1
0.0
X
Density
-1.972
0.02500
1.972
0.02500
0
Distribution Plot
T, df=198
42. 42
PRUEBA T PAREADA
La principal ventaja que tiene la prueba t pareada es que,
al no ser la muestra una fuente de variabilidad, no debería
existir la posibilidad que la cantidad de observaciones sea
diferente, lo cual simplifica el cálculo de la misma.
En lugar de tomar el error estándar acumulado de ambas
muestras, únicamente toma el error estándar de las
diferencias
La fórmula para calcular el estadístico t es la siguiente:
𝑡 =
𝐷 − 𝜇 𝐷
𝑆 𝐷
𝑁
43. 43
PRUEBA T PAREADA
Eg. Se desea analizar el efecto que tiene la nutrición sobre
el IQ en alumnos de 5to de primaria del colegio ABC y para
ello se ha desarrollado el siguiente experimento.
Se escogerán 10 alumnos al azar a los cuales se les
tomará un test estandarizado. Posteriormente se enlistarán
en un programa de nutrición estricta desarrollado por el
colegio. Seis meses después se volvió a aplicar el test
estandarizado para comparar los resultados. Se espera que
el incremento sea de 10 puntos de IQ
Nota: El tamaño de la muestra es pequeño por motivos académicos. Si se
realizara de forma real se requeriría un tamaño mucho mayor.
44. 44
PRUEBA T PAREADA
Eg. Los puntajes obtenidos fueron los siguientes:
X1=110.7
X2=119
E.S=1.3
Primer
test
Segundo
Test
Diferencia
115 121 6
99 104 5
126 126 0
111 124 13
116 127 11
101 109 8
113 124 11
121 131 10
101 107 6
104 117 13
45. 45
PRUEBA T PAREADA
A un 95% de confianza, el valor t9 gl es de 2.262
Planteando las hipótesis:
H0: x2-x1-10=0
H1: x2-x1-10 no es igual a 0
𝑡 =
119 − 110.7 − 10
1.3
𝑡 = 1.3
46. 46
PRUEBA T PAREADA
Como 1.3 es menor que 2.262 Se acepta la
H0, por lo tanto se afirma que el programa
incrementa el IQ de los alumnos en 10 puntos
0.4
0.3
0.2
0.1
0.0
X
Density
-2.262
0.02501
2.262
0.02501
0
Distribution Plot
T, df=9
47. 47
Hernández, R; Fernández, C y Pilar Baptista (2014).
Metodología de la Investigación. México DF. McGraw-
Hill Cap 10.
Field, A (2012). Discovering Statistics Using IBM SPSS
Statistics. Cap 9.
BIBLIOGRAFIA