2. Hipótesis y Contrastes de hipótesis
Hipótesis: Conjetura sobre la población, frecuentemente sobre el
valor de alguno de sus parámetros:
Media
Varianza
Proporción/Tasa
Contraste de hipótesis: Regla que permite tomar una decisión
sobre la validez de la hipótesis planteada
Los contrastes comparan el valor empírico del estadístico bajo la
hipótesis propuesta con el valor supuesto para el parámetro. Esto
permite tomar una decisión asumiendo cierto riesgo
3. Hipótesis nula e Hipótesis alternativa
Hipótesis nula Ho Hipótesis Alternativa H1
La que contrastamos Niega a H0
Implica que la diferencia entre el Implica que la diferencia entre el
valor empírico del estadístico y el valor empírico del estadístico y el
valor supuesto para el parámetro valor supuesto para el parámetro
es estadísticamente nula, es decir, es estadísticamente significativa,
debida a la aleatoriedad del es decir, no debida a la
muestreo aleatoriedad del muestreo
Los datos pueden refutarla Los datos pueden mostrar
No debería ser rechazada sin una evidencia a favor
gran evidencia en contra No debería ser aceptada sin una
gran evidencia a favor.
H 0 : p = 50% = ≤ ≥
, ,
H1 : p ≠ 50% ≠<>
, ,
4. Tipos de error en un contraste de hipótesis
Naturaleza de la hipótesis nula
Decisión sobre H0 H0 cierta H0 Falsa
Correcto Error de tipo II
Aceptar H0 Probabilidad β
Rechazar H0 Error de tipo I
Probabilidad α Correcto
Acepto H1
- Para un tamaño de muestra dado, α y β no se pueden reducir
simultáneamente. Varían de forma inversa.
- Habitualmente se considera que el error tipo I es más grave, por lo cual
se suele fijar su probabilidad α y se trata de que β sea lo menor posible.
5. Ejemplo: Juicio
H0: El acusado es inocente
Realidad
Inocente Culpable
Correcto Error II
Inocente Menos grave
Veredicto
Error I Correcto
Culpable Muy grave
Es más grave condenar a un inocente (Error I) que absolver a un culpable
(Error II). Hay que fijar una probabilidad α que no se desee sobrepasar.
6. Diferencia entre el valor del parámetro y el del estadístico bajo H0
Suponiendo que H0 es cierta (la media de la población es 40) es poco probable
obtener una media muestral de 20
Se rechaza que H0
sea cierta.
µ = 40
X = 20
Este valor de la media muestral conduciría a no aceptar que la hipótesis
nula es cierta (el valor empírico del estadístico bajo H0 sería
improbable).
Sin embargo puede ocurrir y al rechazar H0 asumimos un riesgo
7. Diferencia entre el valor del parámetro y el del estadístico bajo H0
Suponiendo que H0 es cierta (la media de la población es 40) parece
coherente obtener una media muestral de 38
No se puede
rechazar H0
µ = 40
X = 38
Este valor de la media muestral conduciría a aceptar que la hipótesis
nula es cierta. El valor empírico del estadístico bajo H0 no
proporciona evidencias contra H .
8. Región crítica y nivel de significación
Región crítica Nivel de significación: α
Valores extremos del estadístico, Valor pequeño: 1% , 5%
muy ‘improbables’ si H0 es cierta Establecido a priori por el investigador
Valores empíricos del estadístico Es un límite para la probabilidad de
que refutarían H0 rechazar H0 cuando es cierta
Es el tamaño de la región crítica
Es conocida antes de realizar el
experimento. Su tamaño es α
α=5%
Reg. Crit. Reg. Crit.
No rechazo H0
Η0: µ=40
9. Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Bilateral H1: µ≠40
Unilateral Unilateral
Cola izquierda Cola derecha
H1: µ<40 H1: µ>40
10. P-valor
•Es la probabilidad de obtener una muestra como la observada o más
extrema, cuando la hipótesis nula es cierta
•Es la probabilidad de que por puro azar obtengamos una muestra “más
extraña” que la obtenida cuando H0 es cierta
•Es la probabilidad que tendría una región crítica que comenzase
exactamente en el valor del estadístico obtenido de la muestra.
•Es la probabilidad de tener una muestra que discrepe aún más que la
muestra obtenida de H0.
•p-valor es conocido después de la extracción de la muestra
Su valor se compara con α
Si p-valor < α Se rechaza H0
Si p-valor > α No se rechaza H0
11. Contraste no significativo
El contraste es estadísticamente no significativo cuando p>α
Esto significa que el estadístico experimental discrepa menos de “lo
tolerado” a priori.
Por ello, se mantiene la hipótesis nula
No se rechaza
H0: µ= 40
P α
X =43
12. Contraste significativo
El contraste es estadísticamente significativo cuando p<α
Esto significa que el estadístico experimental discrepa más de “lo
tolerado” a priori.
Por ello, no se puede mantener la hipótesis nula
α P
Se rechaza H0: µ=40
Se acepta H1: µ>40
α P
X = 50
13. Algunos contrastes paramétricos
Contraste sobre una media
Objetivo
Probar si la muestra procede de una población cuya media es la
especificada por la hipótesis nula
Condiciones de aplicación
Poblacion normal
Hipótesis
Ho: μ = μ0
H1: μ ≠ μ0
Estadístico
x − µ0
≈ Tn−1
Sc
n
14. Contraste de comparación de 2 medias
Muestras independientes
Objetivo
Probar si las muestras proceden de poblaciones con medias iguales, d0=0,
cuando se ha contrastado que sus varianzas son similares
Condiciones de aplicación
Poblaciones normales. Varianzas iguales
Hipótesis
Ho: μ1- μ2 = d0
H1: μ1 - μ2 ≠ d0
Estadísticox − x ) − d
(1 2 0 ≈ t n1 + n2 − 2
nS +n S
2 2
1 1
1 1 2 2
+
n1 + n2 − 2 n1 n2
15. Contraste de comparación de 2 medias
Muestras independientes
Objetivo
Probar si las muestras proceden de poblaciones con medias iguales, d0=0,
cuando se ha contrastado que sus varianzas son distintas
Condiciones de aplicación
Poblaciones normales. Varianzas distintas
Hipótesis
Ho: μ1= μ2
H1: μ1 ≠ μ2
Estadístico 2
S c21 S c22
( x1 − x2 ) − d 0 ≈ tm m=
n + n
1 2
2
S2
S 2 S c21 S c22
+
c1 c2
n n
n1 n2 1 + 2
n1 − 1 n2 − 1
16. Contraste de comparación de 2 o más varianzas
Prueba de Levene
Objetivo
Probar si las muestras proceden de poblaciones con varianzas iguales.
Condiciones de aplicación
Poblaciones normales
Hipótesis
Ho: Varianzas iguales
H1: No todas las varianzas son iguales
Estadístico
k
∑ ni ( Di − DT )
2
Dij = xij − xi
i =1
k ni
k −1 ni
nj
≈ Fk −1, N − k ∑D ∑∑D
∑ ∑ (D − Di )
k ij ij
2 i =1 j =1
j =1
ij Di = DT =
i =1 j =1 ni N
N−k
17. Contraste de comparación de 2 medias
Muestras relacionadas
Objetivo
Probar si las muestras proceden de poblaciones con medias iguales (d0=0)
Condiciones de aplicación
Población normal
Hipótesis
Ho: μD= d0
H1: μD ≠ d0
Estadístico
D=X1-X2
d − d0
≈ t n−1
Sc( D)
n