Este documento explica los conceptos básicos de la inferencia estadística, incluyendo hipótesis estadísticas, región crítica, tipos de error, y cómo funciona la inferencia estadística tanto para datos paramétricos como no paramétricos. Se usa el ejemplo de una mujer que adivina el contenido de tazas de té para ilustrar cómo se prueban hipótesis estadísticas y cómo se minimizan los tipos de error.
2. La señora que
bebe té…
Ronald Aylmer
Fisher
“Lady at the Tea Table”
~Mary Cassat, circa 1884
Metropolitan Museum of Art
3. Resolviendo el problema…
Sea t el número de tazas de té a las que acierta en cuando a su
contenido
P(t = 10) ≈ 0.10% P(t ≥ 9) ≈ 1.07% P(t ≥ 8) ≈ 5.46%
P(t ≥ 7) ≈ 17.19%
Si le damos una taza hay una probabilidad del 50% de que
adivine…
Si le damos dos tazas la probabilidad de que le atine a ambas
es del 25%...
• Todo el control experimental posible: aleatorización, doble
ciego, etc…
• 10 tazas de té con leche
∑ƒ(t=c)≈ α…
4. Un poco más formal
Se pone a prueba la hipótesis
H0: t ≤ 5vs. Ha: t > 5
…y si t ≥ 9 se rechaza H0 (de lo contrario no se rechaza)
Porque queremos tener menos del 5% de probabilidad de
equivocarnos al decir que la señora sí sabe cuando en realidad fue
cuestión de suerte
Esto es, elegimos un nivel de significancia α = 0.05
5. Cómo funciona la inferencia
POBLACIÓN
En el caso paramétrico, si
podemos censar la población,
obtenemos parámetros para
describirla. Si no, …
MUESTR
A
… tomamos una muestra
representativa y estimamos sus
estadísticos, a partir de los cuáles
…y contrastamos esa
generalización con la
realidad.
6. Isaac Ortega - 2008
Hipótesis
Una creencia sobre la población, usualmente sus
parámetros (u otra medida similar):
Media
Varianza
Proporción/Tasa
Establece la relación entre dos o más variables
OJO: Si queremos contrastarla, debe
establecerse antes del análisis.
Creo que la
señora le va
a atinar a 5
tazas
Fisher, en otra pose de “estar
pensando”
7. Hipótesis estadísticas
Hipótesis nula (H0)
La que contrastamos
Los datos pueden refutarla
No debería ser rechazada
sin una buena razón.
Hip. Alternativa (Ha)
Niega a H0
Los datos pueden mostrar
evidencia a favor
No debería ser aceptada sin una
gran evidencia a favor.
Fisher, antes de dejarse la
barba
∑
8. Razonamiento básico
Supongo que H0 es cierta...
... el resultado del experimento sería improbable.
Sin embargo ocurrió.
Rechazamos H0
9. Razonamiento básico
Si supongo que H0 es cierta...
... el resultado del experimento es coherente.
• No hay evidencia contra H0
• No se rechaza H0
• El experimento no es concluyente
• El contraste no es significativo
¿Si una teoría hace
predicciones con
éxito, queda probado
que es cierta?
10. Región crítica
Región crítica
Valores ‘improbables’ si...
Es conocida antes de realizar el
experimento: resultados
experimentales que refutarían H0
Nivel de significación:
Número pequeño: 1% , 5%
Fijado de antemano por el
investigador
Es la probabilidad de rechazar H0
cuando es cierta
No rechazo H0
Reg. Crit.Reg. Crit.
=5%
0=40
11. Región crítica
La posición de la región crítica depende de la hipótesis alternativa
C. unilateral C. unilateral
Contraste bilateral
H1: <40 H1: >40
H1: 40
12. Tipos de Error
Realidad
CORRECTO
El tratamiento tiene efecto y el
experimento lo confirma.
1-β
(Potencia de la prueba)
ERROR TIPO I
El tratamiento no tiene
efecto pero se decide que
sí.
α
(Nivel de Significancia)
Rechazo H0
Acepto H1
ERROR TIPO II
El tratamiento si tiene efecto
pero no lo percibimos.
β
CORRECTO
El tratamiento no tiene
efecto y así se decide.
1-α
No Rechazo H0
H0 FalsaH0 ciertaDecisión Estadística
13. Minimizar el error
Para un tamaño muestral fijo, no se pueden reducir a la vez la
probabilidad de ambos tipos de error.
Para reducir α ó β, hay que aumentar el tamaño muestral.
Rechazar una hipótesis consiste en observar si p ≤ α
Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error
de tipo I
No rechazar una hipótesis no prueba que sea cierta. Podemos cometer
error de tipo II
Si decidimos rechazar una hipótesis debemos decir cuál es la probabilidad
de equivocarnos.
14. Cómo funciona la inferencia
(cuando no podemos confiar en los
parámetros)
Experimento de Esopo
(medida ordinal)
Muestra: 6 liebres y 6 tortugas
Resultado: T L L L L L T T T T T L
UT= 6 + 1 + 1 + 1 + 1 + 1 = 11
UL = 5 + 5 + 5 + 5 + 5 + 0 = 25
H0: UT ≥ UL
H1: UT < UL
15. Cómo funciona la inferencia
(un ejemplo no paramétrico)
Comparamos los triglicéridos iniciales y de la primera (re-
)visita de 16 sujetos
• Los valores se colocan ordenados
• Se calcula la suma de rangos
• Se calcula el rango promedio
• Se calculan las U
• Se calcula la probabilidad de sus diferencias bajo H0