BIOMETRÍA
242203
242317
02 de Mayo de 2012
Sergio Neira – Hugo Arancibia
• Inferencia estadística (intervalos de confianza y
prueba de hipótesis)
• Hipótesis nula e hipótesis alternativa
• Nivel de significancia y valor crítico del estadístico
de prueba
• Error Tipo I y Error Tipo II
Nuestro objetivo es hacer inferencias sobre una
población (ej. los parámetros que la caracterizan) a
partir de la información contenida en una muestra
elegida al azar.
El procedimiento de prueba de hipótesis es muy
similar al método científico.
Inferencia: Una conclusión que surge de forma lógica a partir de
observaciones o premisas
Método científico:
- Observar la naturaleza de un fenómeno
- Formular una teoría
- Confrontar la teoría con la evidencia observada
Si lo observado difiere de la teoría, se rechaza la hipótesis. En
caso contrario, podemos concluir:
i) La teoría es verdadera, o
ii) La muestra no detectó diferencias importantes o
significativas entre los valores reales y los postulados por la
hipótesis planteada.
¿Qué puede hacer la estadística en lo que se refiere a
pruebas de hipótesis?
¿Cómo decidimos si la información contenida en una
muestra dada está en desacuerdo con la teoría?
¿Es adecuado el tamaño de la muestra?
¿En qué circunstancias deberíamos rechazar/aceptar la
hipótesis?
¿Cómo emitir una conclusión?
Definición: una hipótesis estadística es una afirmación o
conjetura sobre los parámetros de la distribución de
probabilidades de una o más variables aleatorias.
Una Hipótesis estadística simple especifica
completamente la distribución, de lo contrario hablamos
de Hipótesis estadística compuesta.
Denominamos Hipótesis nula, H0 a la hipótesis a ser
probada. A la hipótesis nula contraponemos una segunda
hipótesis que llamaremos Hipótesis alternativa, H0.
Todas las pruebas de hipótesis trabajan en base a
ciertos principios los que se pueden resumir en los
siguientes elementos:
1. Una hipótesis nula H0
2. Una hipótesis alternativa HA
3. Un estadístico de prueba
4. Una zona de rechazo
5. Regla de decisión
6. Conclusión
El estadístico de prueba, al igual que un estimador, es una función
de la muestra. Nos interesa que contenga el máximo de
información sobre la H0 planteada. Es en base a la información
contenida en esta función que se tomará la decisión respecto de la
aceptación o rechazo de H0 .
La zona de rechazo (ZR), también llamada región crítica (RC), define
los valores del estadístico de prueba para los cuales la información
muestral contradice la hipótesis nula. Estos valores permitirán
adoptar una regla de decisión consistente.
Regla de decisión. Si para una muestra particular el estadístico de
prueba (valor calculado) cae dentro de la ZR o RC, rechazaremos H0
en favor de HA . Si el valor no cae dentro de ZR no podremos
rechazar H0 .
El criterio para delimitar los límites de la ZR o RC es similar al
utilizado para los límites de los intervalos de confianza. Esto es,
deseamos rechazar la H0 en aquellos casos en que el parámetro
de interés esté fuera del intervalo de confianza.
Definición: el nivel de significancia ( ) es la probabilidad que
el valor observado del estadístico de prueba esté en la región
crítica o zona de rechazo.
El nivel de significancia también se conoce como “valor-p” de
la prueba de hipótesis y representa la cantidad de evidencia en
contra de H0 encontrada en la muestra bajo el supuesto que H0
es verdadera.
Si es mayor que p: se rechaza H0.
Si es menor que p: se acepta H0.
Una probabilidad de 5% (0.05) o menos se considera un buen
criterio para rechazar H0.
1) H0: µ=10.00 mg/m3 y HA: µ≠10.00 mg/m3
2) Estadístico Z
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
1.96-1.96 0
Imaginemos que tenemos 25 jaibas del inter-mareal de
Bahía Coliumo que fueron expuestas a temperatura
ambiente a 24.3°C. Deseamos saber si la temperatura
corporal de los miembros de esta especie de jaiba es la
misma que la temperatura del aire (24.3°C).
H0: µ=24.3°C
HA: µ≠24.3°C
X
X
Z
Es una variable normal; es útil para
determinar la probabilidad de
obtener una muestra con media
desde una población con una media
específica µ.
El cálculo de Z requiere conocer
el error estándar de la media, que normalmente no es el caso.
La mejor alternativa es calcular
Si n es muy, pero muy pequeño entonces no es un buen estimado
de y no podemos calcular Z usando este estimado.
X
Xs
Xs
X
t
Como sucede con muchas
distribuciones estadísticas, la
distribución t tiene diferentes formas
las que dependen de lo que se
conoce como grados de libertad
(denotado por v).
donde :
Recordemos que n es el número es el tamaño de la muestra
1nv
Ejemplo de test t de dos colas para la diferencia entre una
media poblacional y una media poblacional hipotética.
Individuo Temperatura corporal
1 25.8
2 24.6
3 26.1
4 22.9
5 25.1
6 27.3
7 24.0
8 24.5
9 23.9
10 26.2
11 24.3
12 24.6
13 23.3
14 25.5
15 28.1
16 24.8
17 23.5
18 26.3
19 25.4
20 25.5
21 23.9
22 27.0
23 24.8
24 22.9
25 25.4
Promedio 25.03
varianza 1.80
desv. Est. 1.34
Error est. 0.27
1) H0: µ=24.3°C; HA: µ≠24.3°C
2) Estadístico t
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
Considere: =0.05; n=25; Promedio=25.03°C; v=24;
704.2
27.0
3.2403.25
C
CC
s
X
t
X
2.064-2.064 0
064.224),2(05.0t
24),2(05.0|| tt
Rechazamos H0 y concluimos que la muestra de 25 temperaturas corporales
viene de una muestra cuya media no es 24.3°C
Cuando en una prueba de hipótesis consideramos un valor de
t tan extremo en cualquier dirección respecto de µ que
causará rechazar H0 , decimos que consideramos una prueba
de “dos colas” (o “de dos lados”).
En general, para una prueba t de dos colas rechazamos H0 si:
vtt ),2(||
Cambio de peso de 12 ratas sometidas a un régimen de
ejercicio forzado. Cada cambio en peso (en gramos) es el
peso después del ejercicio menos el peso antes del ejercicio.
Cambio de
peso
1.7
0.7
-0.4
-1.8
0.2
0.9
-1.2
-0.9
-1.8
-1.4
-1.8
-2.0
Promedio -0.7
Varianza 1.6
Desv. Est. 1.3
Muchas veces el valor
hipotético de las hipótesis
nula y alternativa es cero.
H0: µ=0; HA: µ≠0
En muchos casos nuestro interés es saber si la media de
la muestra es significativamente mayor (o
significativamente menor) que µ0.
A esto lo denominaremos prueba de una cola (o prueba
de un lado).
Por ejemplo, consideremos un caso en que se prueba
una droga (derivada de un alga) que causa disminución
del peso en humanos. El investigador está interesado
sólo en si la el peso disminuye después de que se
administra la droga.
Individuo cambio en peso
1 0.2
2 -0.5
3 -1.3
4 -1.6
5 -0.7
6 0.4
7 -0.1
8 0
9 -0.6
10 -1.1
11 -1.2
12 -0.8
-1.796 0
796.111),1(05.0t
H0: µ 0; HA: µ<0
Si estamos interesados que la media de la muestra sea
significativamente mayor que algún valor µ0
H0: µ≤µ0 ; HA: µ> µ0 ; rechazamos H0 si
La situación contraria (que la media de la muestra sea
significativamente menor que algún valor µ0 )
H0: µ µ0 ; HA: µ< µ0 ; rechazamos H0 si
vtt ),1(
vtt ),1(
Hipótesis para la diferencia de dos medias
Hipótesis relacionadas con la varianza
Distribución X2

Biometria clase 8

  • 1.
    BIOMETRÍA 242203 242317 02 de Mayode 2012 Sergio Neira – Hugo Arancibia
  • 2.
    • Inferencia estadística(intervalos de confianza y prueba de hipótesis) • Hipótesis nula e hipótesis alternativa • Nivel de significancia y valor crítico del estadístico de prueba • Error Tipo I y Error Tipo II
  • 3.
    Nuestro objetivo eshacer inferencias sobre una población (ej. los parámetros que la caracterizan) a partir de la información contenida en una muestra elegida al azar. El procedimiento de prueba de hipótesis es muy similar al método científico. Inferencia: Una conclusión que surge de forma lógica a partir de observaciones o premisas
  • 4.
    Método científico: - Observarla naturaleza de un fenómeno - Formular una teoría - Confrontar la teoría con la evidencia observada Si lo observado difiere de la teoría, se rechaza la hipótesis. En caso contrario, podemos concluir: i) La teoría es verdadera, o ii) La muestra no detectó diferencias importantes o significativas entre los valores reales y los postulados por la hipótesis planteada.
  • 5.
    ¿Qué puede hacerla estadística en lo que se refiere a pruebas de hipótesis? ¿Cómo decidimos si la información contenida en una muestra dada está en desacuerdo con la teoría? ¿Es adecuado el tamaño de la muestra? ¿En qué circunstancias deberíamos rechazar/aceptar la hipótesis? ¿Cómo emitir una conclusión?
  • 6.
    Definición: una hipótesisestadística es una afirmación o conjetura sobre los parámetros de la distribución de probabilidades de una o más variables aleatorias. Una Hipótesis estadística simple especifica completamente la distribución, de lo contrario hablamos de Hipótesis estadística compuesta. Denominamos Hipótesis nula, H0 a la hipótesis a ser probada. A la hipótesis nula contraponemos una segunda hipótesis que llamaremos Hipótesis alternativa, H0.
  • 7.
    Todas las pruebasde hipótesis trabajan en base a ciertos principios los que se pueden resumir en los siguientes elementos: 1. Una hipótesis nula H0 2. Una hipótesis alternativa HA 3. Un estadístico de prueba 4. Una zona de rechazo 5. Regla de decisión 6. Conclusión
  • 8.
    El estadístico deprueba, al igual que un estimador, es una función de la muestra. Nos interesa que contenga el máximo de información sobre la H0 planteada. Es en base a la información contenida en esta función que se tomará la decisión respecto de la aceptación o rechazo de H0 . La zona de rechazo (ZR), también llamada región crítica (RC), define los valores del estadístico de prueba para los cuales la información muestral contradice la hipótesis nula. Estos valores permitirán adoptar una regla de decisión consistente. Regla de decisión. Si para una muestra particular el estadístico de prueba (valor calculado) cae dentro de la ZR o RC, rechazaremos H0 en favor de HA . Si el valor no cae dentro de ZR no podremos rechazar H0 .
  • 9.
    El criterio paradelimitar los límites de la ZR o RC es similar al utilizado para los límites de los intervalos de confianza. Esto es, deseamos rechazar la H0 en aquellos casos en que el parámetro de interés esté fuera del intervalo de confianza.
  • 10.
    Definición: el nivelde significancia ( ) es la probabilidad que el valor observado del estadístico de prueba esté en la región crítica o zona de rechazo. El nivel de significancia también se conoce como “valor-p” de la prueba de hipótesis y representa la cantidad de evidencia en contra de H0 encontrada en la muestra bajo el supuesto que H0 es verdadera. Si es mayor que p: se rechaza H0. Si es menor que p: se acepta H0. Una probabilidad de 5% (0.05) o menos se considera un buen criterio para rechazar H0.
  • 11.
    1) H0: µ=10.00mg/m3 y HA: µ≠10.00 mg/m3 2) Estadístico Z 3) Zona de rechazo 4) Regla de decisión 5) Conclusión 1.96-1.96 0
  • 12.
    Imaginemos que tenemos25 jaibas del inter-mareal de Bahía Coliumo que fueron expuestas a temperatura ambiente a 24.3°C. Deseamos saber si la temperatura corporal de los miembros de esta especie de jaiba es la misma que la temperatura del aire (24.3°C). H0: µ=24.3°C HA: µ≠24.3°C
  • 13.
    X X Z Es una variablenormal; es útil para determinar la probabilidad de obtener una muestra con media desde una población con una media específica µ. El cálculo de Z requiere conocer el error estándar de la media, que normalmente no es el caso. La mejor alternativa es calcular Si n es muy, pero muy pequeño entonces no es un buen estimado de y no podemos calcular Z usando este estimado. X Xs
  • 14.
    Xs X t Como sucede conmuchas distribuciones estadísticas, la distribución t tiene diferentes formas las que dependen de lo que se conoce como grados de libertad (denotado por v). donde : Recordemos que n es el número es el tamaño de la muestra 1nv
  • 16.
    Ejemplo de testt de dos colas para la diferencia entre una media poblacional y una media poblacional hipotética. Individuo Temperatura corporal 1 25.8 2 24.6 3 26.1 4 22.9 5 25.1 6 27.3 7 24.0 8 24.5 9 23.9 10 26.2 11 24.3 12 24.6 13 23.3 14 25.5 15 28.1 16 24.8 17 23.5 18 26.3 19 25.4 20 25.5 21 23.9 22 27.0 23 24.8 24 22.9 25 25.4 Promedio 25.03 varianza 1.80 desv. Est. 1.34 Error est. 0.27 1) H0: µ=24.3°C; HA: µ≠24.3°C 2) Estadístico t 3) Zona de rechazo 4) Regla de decisión 5) Conclusión Considere: =0.05; n=25; Promedio=25.03°C; v=24;
  • 17.
    704.2 27.0 3.2403.25 C CC s X t X 2.064-2.064 0 064.224),2(05.0t 24),2(05.0|| tt RechazamosH0 y concluimos que la muestra de 25 temperaturas corporales viene de una muestra cuya media no es 24.3°C
  • 18.
    Cuando en unaprueba de hipótesis consideramos un valor de t tan extremo en cualquier dirección respecto de µ que causará rechazar H0 , decimos que consideramos una prueba de “dos colas” (o “de dos lados”). En general, para una prueba t de dos colas rechazamos H0 si: vtt ),2(||
  • 19.
    Cambio de pesode 12 ratas sometidas a un régimen de ejercicio forzado. Cada cambio en peso (en gramos) es el peso después del ejercicio menos el peso antes del ejercicio. Cambio de peso 1.7 0.7 -0.4 -1.8 0.2 0.9 -1.2 -0.9 -1.8 -1.4 -1.8 -2.0 Promedio -0.7 Varianza 1.6 Desv. Est. 1.3 Muchas veces el valor hipotético de las hipótesis nula y alternativa es cero. H0: µ=0; HA: µ≠0
  • 20.
    En muchos casosnuestro interés es saber si la media de la muestra es significativamente mayor (o significativamente menor) que µ0. A esto lo denominaremos prueba de una cola (o prueba de un lado). Por ejemplo, consideremos un caso en que se prueba una droga (derivada de un alga) que causa disminución del peso en humanos. El investigador está interesado sólo en si la el peso disminuye después de que se administra la droga.
  • 21.
    Individuo cambio enpeso 1 0.2 2 -0.5 3 -1.3 4 -1.6 5 -0.7 6 0.4 7 -0.1 8 0 9 -0.6 10 -1.1 11 -1.2 12 -0.8 -1.796 0 796.111),1(05.0t H0: µ 0; HA: µ<0
  • 22.
    Si estamos interesadosque la media de la muestra sea significativamente mayor que algún valor µ0 H0: µ≤µ0 ; HA: µ> µ0 ; rechazamos H0 si La situación contraria (que la media de la muestra sea significativamente menor que algún valor µ0 ) H0: µ µ0 ; HA: µ< µ0 ; rechazamos H0 si vtt ),1( vtt ),1(
  • 23.
    Hipótesis para ladiferencia de dos medias Hipótesis relacionadas con la varianza Distribución X2