Este documento explica los conceptos fundamentales de las pruebas de hipótesis. Describe los cuatro componentes clave de una prueba de hipótesis: la hipótesis nula, la hipótesis alternativa, la estadística de prueba y la región de rechazo. También explica los tipos de errores que pueden ocurrir y cómo se calculan las probabilidades de cometer errores. Además, proporciona ejemplos detallados de cómo realizar pruebas de hipótesis para diferentes tipos de parámetros pob
2. Pruebas de HipótesisPruebas de Hipótesis
Otra manera de hacer inferencia es haciendo una
afirmación acerca del valor que el parámetro de la
población bajo estudio puede tomar. Esta
afirmación puede estar basada en alguna creencia
o experiencia pasada que será contrastada con la
evidencia que nosotros obtengamos a través de la
información contenida en la muestra. Esto es a lo
que llamamos Prueba de Hipótesis
v.rohen
3. Una prueba de hipótesis comprende cuatro
componentes principales:
-Hipótesis Nula
-Hipótesis Alternativa
-Estadística de Prueba
-Región de Rechazo
v.rohen
4. La Hipótesis Nula, denotada como H0 siempre
especifica un solo valor del parámetro de la
población si la hipótesis es simple o un conjunto de
valores si es compuesta (es lo que queremos
desacreditar)
La Hipótesis Alternativa, denotada como H1 es la
que responde nuestra pregunta, la que se establece
en base a la evidencia que tenemos. Puede tener
cuatro formas:
!
H0 :µ = µ0
0101
0111
::
::
µµµµ
µµµµ
!<
>=
HH
HH
!
H0 :µ " µ0
!
H0 :µ " µ0
v.rohen
5. Como las conclusiones a las que lleguemos se
basan en una muestra, hay posibilidades de
que nos equivoquemos.
Dos decisiones correctas son posibles:
Rechazar H0 cuando es falsa
No Rechazar H0 cuando es verdadera.
Dos decisiones incorrectas son posibles:
Rechazar H0 cuando es verdadera
No Rechazar H0 cuando es falsa.
v.rohen
6. Tamaño de los errores al tomar una decisión
incorrecta en una Prueba de Hipótesis
H 0 Verdadera H 0 Falsa
Rechazamos H 0
Error Tipo IError Tipo I
P(error Tipo I) =P(error Tipo I) = αα
Decisión CorrectaDecisión Correcta
No Rechazamos H 0 Decisión CorrectaDecisión Correcta
Error Tipo IIError Tipo II
P(error Tipo II) =P(error Tipo II) = ββ
v.rohen
7. La Probabilidad de cometer un error Tipo I se
conoce como Nivel de Significancia, se denota
como α y es el tamaño de la región de rechazo
El complemento de la región de rechazo es 1−α
y es conocido como el Coeficiente de Confianza
En una prueba de Hipótesis de dos colas la
región de no rechazo corresponde a un
intervalo de confianza para el parámetro en
cuestión
v.rohen
8. La Región de Rechazo es el conjunto de valores
tales que si la prueba estadística cae dentro de
este rango, decidimos rechazar la Hipótesis Nula
Su localización depende de la forma de la
Hipótesis Alternativa:
Si entonces la región se encuentra en
la cola derecha de la distribución de la
estadística de prueba.
01 : µµ >H
v.rohen
9. Si entonces la región se encuentra en
la cola izquierda de la distribución de la
estadística de prueba
Si entonces la región se divide en dos
partes, una parte estará en la cola derecha de la
distribución de la estadística de prueba y la otra
en la cola izquierda de la distribución de la
estadística de prueba.
01 : µµ !H
01 : µµ <H
v.rohen
10. Conclusiones de una Prueba de Hipótesis
Si rechazamos la Hipótesis Nula, concluimos
que “hay suficiente evidencia estadística para
inferir que la hipótesis nula es falsa”
Si no rechazamos la Hipótesis Nula, concluimos
que “no hay suficiente evidencia estadística
para inferir que la hipótesis nula es falsa”
v.rohen
13. La Estadística de Prueba es una estadística que se
deriva del estimador puntual del parámetro que
estemos probando y en ella basamos nuestra
decisión acerca de si rechazar o no rechazar la
Hipótesis Nula
Ejemplo:
Siempre se calcula considerando la Hipótesis
Nula como si fuera verdadera.!
Z =
ˆµ " µ0
#
n
v.rohen
14. Para el caso específico de la media poblacional µ,
el estimador es cuya varianza es .
Supondremos que conocemos la varianza
poblacional
X=µˆ n2
!
2
!
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
00 : µµ =H
01 : µµ >H01 : µµ <H 01 : µµ !H
Z : Z > Z1"#{ }Z : Z < Z"{ } Z : Z > Z1"# /2{ }
X
Z
!
µµ 0"
=
ˆ
v.rohen
15. Si nuestro propósito está en la proporción de éxitos p,
el estimador será que tiene distribución
aproximada normal con media p y varianza p(1-p)/n,
donde p toma el valor propuesto por la hipótesis nula.
!
ˆp = X
n
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
00 : ppH =
01 : ppH >01 : ppH < 01 : ppH !
Z : Z > Z1"#{ }Z : Z < Z"{ } Z : Z > Z1"# /2{ }
!
Z =
ˆp " p0
# ˆp
v.rohen
16. Cuando la varianza poblacional no es conocida,
sabemos que la podemos estimar con la varianza
muestral, siendo la distribución de la estadística de
prueba una t - Student con n-1 grados de libertad.
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
00 : µµ =H
01 : µµ >H01 : µµ <H 01 : µµ !H
T :T > tn"1,1"#{ } T : T > tn"1,1"# /2{ }
!
T =
ˆµ " µ0
S n
T :T < tn"1,#{ }
v.rohen
17. Para el caso de comparar las medias de dos
poblaciones independientes (tamaño de muestras
grande), y las varianzas son conocidas, la prueba se
realiza de la siguiente manera:
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
210 : µµ =H
211 : µµ >H211 : µµ <H 211 : µµ !H
!
Z =
X1 " X2
# X1
+ # X 2
!
Z : Z < Z"{ } Z : Z > Z1"#{ } Z : Z > Z1"# /2{ }
v.rohen
18. Si la comparación es de proporciones de dos
poblaciones independientes, la prueba será
donde .
Recordemos que para usar la aproximación normal es necesario que
, donde es el tamaño de la muestra i (i=1,2)
21
21
ˆ
nn
XX
p
+
+
=
!
ni p > 5 in
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
210 : ppH =
211 : ppH >211 : ppH < 211 : ppH !
!
Z =
ˆp1 " ˆp2
ˆp(1" ˆp) 1
n1
+ 1
n2
( )
!
Z : Z > Z1"# /2{ }
!
Z : Z > Z1"#{ }
!
Z : Z < Z"{ }
v.rohen
19. Para la diferencia de medias podemos suponer que las
varianzas poblacionales son iguales (este hecho se tiene que
probar como se muestra mas adelante).
Donde es el estimador de varianza mínima para σ 2.
La prueba se basa en una t con n1-n2-2 grados de libertad.
2
)1()1(
21
2
22
2
112
!+
!+!
=
nn
SnSn
Sp
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
210 : µµ =H
211 : µµ >H211 : µµ <H 211 : µµ !H
!
T =
X1 " X2
Sp
1
n1
+ 1
n2
!
T :T > tn"1,1"#{ }
!
T : T > tn"1,1"# /2{ }
!
T :T < tn"1,#{ }
v.rohen
20. Para la diferencia de medias cuando nuestras muestras están
pareadas (misma medición, misma unidad experimental,
circunstancias diferentes) podemos usar la prueba de
diferencia de medias. Sin embargo debemos notar que la
varianza de la diferencia de medias lleva implícita la
covarianza entre los estimadores
!
X1 y X2
Hipótesis
Nula
Alternativa
Estadística de
Prueba
R. Rechazo
( )210210 0:: µµµµµµ !=="= DDHH
0:1 >DH µ0:1 <DH µ 0:1 !DH µ
!
T =
D
SD n
( )21
2
2
2
1
2
2 !"!!!! #+=D
T :T > tn"1,1"#{ } T : T > tn"1,1"# /2{ }T :T < tn"1,#{ }
v.rohen
21. Con frecuencia nuestro interés está en el parámetro de
variabilidad, en cuyo caso podemos hacer las pruebas
sobre un valor específico de la varianza poblacional.
Para ello nos basamos en el estimador del estimador de
σ2 que es una χ2 con n-1 grados de libertad.
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
2
0
2
0 : !! =H
2
0
2
1 : !! >H2
0
2
1 : !! <H 2
0
2
1 : !! "H
!
X2
: X2
< "n#1,$
2
{ }
!
X2
: X2
< "n#1,$ /2
2
ó
X2
: X2
> "n#1,1#$ /2
2
%
&
'
('
)
*
'
+'
!
X2
=
(n "1)S2
#0
2
!
X2
: X2
> "n#1,1#$
2
{ }
v.rohen
22. El supuesto de varianzas iguales que se ha hecho al comparar
las medias de dos poblaciones, deberá ahora probarse
mediante la estadística F
Hipótesis
Nula
Alternativa
Estadística
de Prueba
R. Rechazo
2
2
2
10 : !! =H
2
2
2
11 : !! >H2
2
2
11 : !! <H 2
2
2
11 : !! "H
!
F : F > Fn1 "1,n2 "1,1"#{ }
!
F =
max S1
2
,S2
2
{ }
min S1
2
,S2
2
{ }
!
F : F > Fn1 "1,n2 "1,1"# / 2{ }
v.rohen
23. valor-pvalor-p es el nivel de significancia alcanzado.
El nivel de significancia más pequeño al cual los
datos observados indican que la hipótesis nula
debe ser rechazada.
Si W es una estadística de prueba y w0 es el
valor observado, el valor-p nos indica la
probabilidad de que w0 sea un valor extremo:
( )es ciertacuando HwWPpvalor 0,0!="
( )es ciertacuando HwWPpvalor 0,0!="
v.rohen
24. v.rohen
Prueba acerca del Coeficiente de Correlación
Si queremos ver si realmente existe una medida de
relación lineal entre dos variables X y Y en una
población que tiene una distribución bivariada normal,
la hipótesis será .
Usamos la estadística de prueba
que tiene una distribución t-Student con n-2 grados de
libertad.
!
Ho : " = 0
!
T = r
n " 2
1" r2
25. v.rohen
Si la población bivariada está lejos de una normal,
podemos usar los rangos de las medidas de cada variable
y calcular la medida de relación conocida como coeficiente
de correlación rangos de Spearman
!
rs =1"
6 di
2
i=1
n
#
n3
" n
donde di es la diferencia entre los rangos de X y los de Y.
El valor crítico se busca en tablas de Coeficiente de
Correlación de Rangos de Spearman
(Cf. J.H.Zar.- Biostatistical Analysis)