Este documento presenta conceptos básicos de inferencia estadística como intervalos de confianza, hipótesis nula e hipótesis alternativa, nivel de significancia, errores tipo I y tipo II. Explica que el objetivo es hacer inferencias sobre una población a partir de una muestra, y que el procedimiento de prueba de hipótesis es similar al método científico. Resume los elementos clave de una prueba de hipótesis: hipótesis nula, hipótesis alternativa, estadístico de prueba, z
2. • Inferencia estadística (intervalos de confianza y
prueba de hipótesis)
• Hipótesis nula e hipótesis alternativa
• Nivel de significancia y valor crítico del estadístico
de prueba
• Error Tipo I y Error Tipo II
3. Nuestro objetivo es hacer inferencias sobre una
población (ej. los parámetros que la caracterizan) a
partir de la información contenida en una muestra
elegida al azar.
El procedimiento de prueba de hipótesis es muy
similar al método científico.
Inferencia: Una conclusión que surge de forma lógica a partir de
observaciones o premisas
4. Método científico:
- Observar la naturaleza de un fenómeno
- Formular una teoría
- Confrontar la teoría con la evidencia observada
Si lo observado difiere de la teoría, se rechaza la hipótesis. En
caso contrario, podemos concluir:
i) La teoría es verdadera, o
ii) La muestra no detectó diferencias importantes o
significativas entre los valores reales y los postulados por la
hipótesis planteada.
5. ¿Qué puede hacer la estadística en lo que se refiere a
pruebas de hipótesis?
¿Cómo decidimos si la información contenida en una
muestra dada está en desacuerdo con la teoría?
¿Es adecuado el tamaño de la muestra?
¿En qué circunstancias deberíamos rechazar/aceptar la
hipótesis?
¿Cómo emitir una conclusión?
6. Definición: una hipótesis estadística es una afirmación o
conjetura sobre los parámetros de la distribución de
probabilidades de una o más variables aleatorias.
Una Hipótesis estadística simple especifica
completamente la distribución, de lo contrario hablamos
de Hipótesis estadística compuesta.
Denominamos Hipótesis nula, H0 a la hipótesis a ser
probada. A la hipótesis nula contraponemos una segunda
hipótesis que llamaremos Hipótesis alternativa, H0.
7. Todas las pruebas de hipótesis trabajan en base a
ciertos principios los que se pueden resumir en los
siguientes elementos:
1. Una hipótesis nula H0
2. Una hipótesis alternativa HA
3. Un estadístico de prueba
4. Una zona de rechazo
5. Regla de decisión
6. Conclusión
8. El estadístico de prueba, al igual que un estimador, es una función
de la muestra. Nos interesa que contenga el máximo de
información sobre la H0 planteada. Es en base a la información
contenida en esta función que se tomará la decisión respecto de la
aceptación o rechazo de H0 .
La zona de rechazo (ZR), también llamada región crítica (RC), define
los valores del estadístico de prueba para los cuales la información
muestral contradice la hipótesis nula. Estos valores permitirán
adoptar una regla de decisión consistente.
Regla de decisión. Si para una muestra particular el estadístico de
prueba (valor calculado) cae dentro de la ZR o RC, rechazaremos H0
en favor de HA . Si el valor no cae dentro de ZR no podremos
rechazar H0 .
9. El criterio para delimitar los límites de la ZR o RC es similar al
utilizado para los límites de los intervalos de confianza. Esto es,
deseamos rechazar la H0 en aquellos casos en que el parámetro
de interés esté fuera del intervalo de confianza.
10. Definición: el nivel de significancia ( ) es la probabilidad que
el valor observado del estadístico de prueba esté en la región
crítica o zona de rechazo.
El nivel de significancia también se conoce como “valor-p” de
la prueba de hipótesis y representa la cantidad de evidencia en
contra de H0 encontrada en la muestra bajo el supuesto que H0
es verdadera.
Si es mayor que p: se rechaza H0.
Si es menor que p: se acepta H0.
Una probabilidad de 5% (0.05) o menos se considera un buen
criterio para rechazar H0.
11. 1) H0: µ=10.00 mg/m3 y HA: µ≠10.00 mg/m3
2) Estadístico Z
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
1.96-1.96 0
12. Imaginemos que tenemos 25 jaibas del inter-mareal de
Bahía Coliumo que fueron expuestas a temperatura
ambiente a 24.3°C. Deseamos saber si la temperatura
corporal de los miembros de esta especie de jaiba es la
misma que la temperatura del aire (24.3°C).
H0: µ=24.3°C
HA: µ≠24.3°C
13. X
X
Z
Es una variable normal; es útil para
determinar la probabilidad de
obtener una muestra con media
desde una población con una media
específica µ.
El cálculo de Z requiere conocer
el error estándar de la media, que normalmente no es el caso.
La mejor alternativa es calcular
Si n es muy, pero muy pequeño entonces no es un buen estimado
de y no podemos calcular Z usando este estimado.
X
Xs
14. Xs
X
t
Como sucede con muchas
distribuciones estadísticas, la
distribución t tiene diferentes formas
las que dependen de lo que se
conoce como grados de libertad
(denotado por v).
donde :
Recordemos que n es el número es el tamaño de la muestra
1nv
15.
16. Ejemplo de test t de dos colas para la diferencia entre una
media poblacional y una media poblacional hipotética.
Individuo Temperatura corporal
1 25.8
2 24.6
3 26.1
4 22.9
5 25.1
6 27.3
7 24.0
8 24.5
9 23.9
10 26.2
11 24.3
12 24.6
13 23.3
14 25.5
15 28.1
16 24.8
17 23.5
18 26.3
19 25.4
20 25.5
21 23.9
22 27.0
23 24.8
24 22.9
25 25.4
Promedio 25.03
varianza 1.80
desv. Est. 1.34
Error est. 0.27
1) H0: µ=24.3°C; HA: µ≠24.3°C
2) Estadístico t
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
Considere: =0.05; n=25; Promedio=25.03°C; v=24;
18. Cuando en una prueba de hipótesis consideramos un valor de
t tan extremo en cualquier dirección respecto de µ que
causará rechazar H0 , decimos que consideramos una prueba
de “dos colas” (o “de dos lados”).
En general, para una prueba t de dos colas rechazamos H0 si:
vtt ),2(||
19. Cambio de peso de 12 ratas sometidas a un régimen de
ejercicio forzado. Cada cambio en peso (en gramos) es el
peso después del ejercicio menos el peso antes del ejercicio.
Cambio de
peso
1.7
0.7
-0.4
-1.8
0.2
0.9
-1.2
-0.9
-1.8
-1.4
-1.8
-2.0
Promedio -0.7
Varianza 1.6
Desv. Est. 1.3
Muchas veces el valor
hipotético de las hipótesis
nula y alternativa es cero.
H0: µ=0; HA: µ≠0
20. En muchos casos nuestro interés es saber si la media de
la muestra es significativamente mayor (o
significativamente menor) que µ0.
A esto lo denominaremos prueba de una cola (o prueba
de un lado).
Por ejemplo, consideremos un caso en que se prueba
una droga (derivada de un alga) que causa disminución
del peso en humanos. El investigador está interesado
sólo en si la el peso disminuye después de que se
administra la droga.
22. Si estamos interesados que la media de la muestra sea
significativamente mayor que algún valor µ0
H0: µ≤µ0 ; HA: µ> µ0 ; rechazamos H0 si
La situación contraria (que la media de la muestra sea
significativamente menor que algún valor µ0 )
H0: µ µ0 ; HA: µ< µ0 ; rechazamos H0 si
vtt ),1(
vtt ),1(
23. Hipótesis para la diferencia de dos medias
Hipótesis relacionadas con la varianza
Distribución X2