19. APROXIMACIONES ENTRE LAS DISTRIBUCIONES
BINOMIAL, NORMAL Y POISSON
N (µ, σ)
media = µ
varianza = σ2
np > 5
nq > 5
p, q > 0,05
λ > 10
B (n, p)
Buena aproximación:
n ≥ 10 y p ≤ 0,05 P (λ)
media = np
varianza = npq
Muy buena aproxiamción:
n ≥ 100 y np ≤ 10
media = λ
varianza = λ
19
20. ESTIMACIÓN
Intervalo de Confianza para la media µ
Si σ es conocida
½
∗ si X es normal o
∗ si n > 60
V µ ∈ ¯x ± zασ/
√
n
Si σ es desconocida
∗ si n > 60 ⇒ µ ∈ ¯x ± zαs/
√
n
∗ si n ≤ 60 y X es normal ⇒ µ ∈ ¯x ± tα(n − 1)s/
√
n
Intervalo de Confianza para la varianza σ2
Condiciones: X ∼ N(µ, σ)
σ2
∈
"
(n − 1)s2
χ2
α/2(n − 1)
,
(n − 1)s2
χ2
1−α/2(n − 1)
#
Intervalo de Confianza para una proporción p
Condiciones: nˆp, nˆq > 5, ˆp, ˆq > 0,05
p ∈ ˆp ± zα
p
ˆpˆq/n
20
21. TEST DE HIPÓTESIS: CONTRASTES PARA UNA VARIABLE
Contraste para la media µ
1)
½
H0 : µ = µ0
H1 : µ 6= µ0
2)
½
H0 : µ ≤ µ0
H1 : µ > µ0
3)
½
H0 : µ ≥ µ0
H1 : µ < µ0
• Si σ es conocida
½
∗ si X es normal o
∗ si n > 60
V texp =
¯x − µ0
σ/
√
n
, Cα = zα
• Si σ es desconocida
∗ si n > 60 ⇒ texp =
¯x − µ0
s/
√
n
, Cα = zα
∗ si n ≤ 60 y X es normal ⇒ texp =
¯x − µ0
s/
√
n
, Cα = tα(n − 1)
1) Si |texp| < Cα ⇒ H0 : µ = µ0
2) Si texp < C2α ⇒ H0 : µ ≤ µ0
3) Si texp > −C2α ⇒ H0 : µ ≥ µ0
Contraste para la varianza σ2
1)
½
H0 : σ2
= σ2
0
H1 : σ2
6= σ2
0
2)
½
H0 : σ2
≤ σ2
0
H1 : σ2
> σ2
0
3)
½
H0 : σ2
≥ σ2
0
H1 : σ2
< σ2
0
Condiciones: X ∼ N(µ, σ) ⇒ texp =
(n − 1)s2
σ2
0
1) Si texp ∈
h
χ2
1−α/2(n − 1), χ2
α/2(n − 1)
i
⇒ H0 : σ2
= σ2
0
2) Si texp < χ2
α(n − 1) ⇒ H0 : σ2
≤ σ2
0
3) Si texp > χ2
1−α(n − 1) ⇒ H0 : σ2
≥ σ2
0
Contraste para una proporción p
1)
½
H0 : p = p0
H1 : p 6= p0
2)
½
H0 : p ≤ p0
H1 : p > p0
3)
½
H0 : p ≥ p0
H1 : p < p0
Condiciones: np0, nq0 > 5, p0, q0 > 0,05 ⇒ texp =
ˆp − p0
p
p0q0/n
1) Si |texp| < zα ⇒ H0 : p = p0
2) Si texp < z2α ⇒ H0 : p ≤ p0
3) Si texp > −z2α ⇒ H0 : p ≥ p0
21
22. TEST DE HIPÓTESIS: CONTRASTES PARA DOS VARIABLES
Comparación de Varianzas
1)
½
H0 : σ2
1 = σ2
2
H1 : σ2
1 6= σ2
2
2)
½
H0 : σ2
1 ≤ σ2
2
H1 : σ2
1 > σ2
2
3)
½
H0 : σ2
1 ≥ σ2
2
H1 : σ2
1 < σ2
2
Condiciones:
· Poblaciones normales: X ∼ N(µ1, σ1), Y ∼ N(µ2, σ2)
· Muestras independientes de tamaños m y n
V Fexp =
s2
1
s2
2
1) Si Fexp ∈
£
F1−α/2(m − 1, n − 1), Fα/2(m − 1, n − 1)
¤
⇒ H0 : σ2
1 = σ2
2
2) Si Fexp < Fα(m − 1, n − 1) ⇒ H0 : σ2
1 ≤ σ2
2
3) Si Fexp > F1−α(m − 1, n − 1) ⇒ H0 : σ2
1 ≥ σ2
2
Intervalo de Confianza para el cociente de varianzas
Bajo las anteriores condiciones,
σ2
1
σ2
2
∈
·
s2
1
s2
2
1
Fα/2(m − 1, n − 1)
,
s2
1
s2
2
1
F1−α/2(m − 1, n − 1)
¸
Nota: F1−α(m, n) =
1
Fα(n, m)
22
23. Comparación de Medias para muestras independientes
1)
½
H0 : µ1 = µ2
H1 : µ1 6= µ2
2)
½
H0 : µ1 ≤ µ2
H1 : µ1 > µ2
3)
½
H0 : µ1 ≥ µ2
H1 : µ1 < µ2
• Si σ1, σ2 son conocidas
(
∗ si X e Y son normales o
∗ si m, n ≥ 60
V
texp =
¯x − ¯y
p
σ2
1/m + σ2
2/n
Cα = zα
• Si σ1, σ2 son desconocidas
∗ Si m, n ≥ 60 ⇒
texp =
¯x − ¯y
p
s2
1/m + s2
2/n
Cα = zα
∗ Si X e Y son normales
∗ si σ1 = σ2 V
texp =
¯x − ¯y
s
p
1/m + 1/n
Cα = tα(m + n − 2)
Cα = zα si m + n − 2 ≥ 60
∗ si σ1 6= σ2 V
texp =
¯x − ¯y
p
s2
1/m + s2
2/n
Cα = tα(f)
Cα = zα si f ≥ 60
s2
=
(m − 1)s2
1 + (n − 1)s2
2
m + n − 2
, f =
(s2
1/m + s2
2/n)2
(s2
1/m)2
m − 1
+
(s2
2/n)2
n − 1
1) Si |texp| < Cα ⇒ H0 : µ1 = µ2
2) Si texp < C2α ⇒ H0 : µ1 ≤ µ2
3) Si texp > −C2α ⇒ H0 : µ1 ≥ µ2
Intervalo de confianza para la diferencia de medias (muestras independientes)
Si D(texp) es el denominador de texp ,
µ1 − µ2 ∈ (¯x − ¯y) ± CαD(texp)
23
24. Comparación de Medias para muestras apareadas
1)
½
H0 : µ1 = µ2
H1 : µ1 6= µ2
2)
½
H0 : µ1 ≤ µ2
H1 : µ1 > µ2
3)
½
H0 : µ1 ≥ µ2
H1 : µ1 < µ2
Condiciones:
· Para muestras apareadas
· Si D = X − Y ∼ N(µD, σD), con µD = µ1 − µ2 ⇒ Cα = tα(n − 1)
· Si n ≥ 60, aunque no haya normalidad ⇒ Cα = zα
En todo caso, texp =
¯d
sD/
√
n
donde ¯d y sD son la media y la desviación típica de los datos
di = xi − yi, i = 1, 2, . . . , n
1) Si |texp| < Cα ⇒ H0 : µ1 = µ2
2) Si texp < C2α ⇒ H0 : µ1 ≤ µ2
3) Si texp > −C2α ⇒ H0 : µ1 ≥ µ2
Intervalo de confianza para la diferencia de medias (muestras apareadas)
Bajo las mismas condiciones,
µ1 − µ2 ∈ ¯d ± Cα
sD
√
n
24
25. Comparación de Proporciones
1)
½
H0 : p1 = p2
H1 : p1 6= p2
2)
½
H0 : p1 ≤ p2
H1 : p1 > p2
3)
½
H0 : p1 ≥ p2
H1 : p1 < p2
• Muestras Independientes
Consideramos dos muestras independientes 1 y 2 de tamaños n1 y n2
Muestra Si No
1 x1 n1 − x1 n1
2 x2 n2 − x2 n2
ˆpi =
xi
ni
, ˆqi = 1 − pi, i = 1, 2
ˆp =
x1 + x2
n1 + n2
, ˆq = 1 − ˆp
∗ Condiciones:
· ni ˆpi > 5, i = 1, 2
· ni ˆqi > 5, i = 1, 2
· ˆpi, ˆqi > 0,05, i = 1, 2
V texp =
ˆp1 − ˆp2
s
ˆpˆq
µ
1
n1
+
1
n2
¶
∗ Intervalo de confianza bajo las mismas condiciones:
p1 − p2 ∈ ( ˆp1 − ˆp2) ± zα
r
ˆp1 ˆq1
n1
+
ˆp2 ˆq2
n2
• Muestras Apareadas
Consideramos dos muestras apareadas 1 y 2 de tamaño n
12 Si No
Si n11 n12
No n21 n22
n
∗ Condición: n12 + n21 > 10 V texp =
n12 − n21
√
n12 + n21
∗ Intervalo de confianza bajo las mismas condiciones y n12, n21 > 5:
p1 − p2 ∈
1
n
Ã
(n12 − n21) ± zα
r
n12 + n21 −
(n12 − n21)2
n
!
En ambos casos:
1) Si |texp| < zα ⇒ H0 : p1 = p2
2) Si texp < z2α ⇒ H0 : p1 ≤ p2
3) Si texp > −z2α ⇒ H0 : p1 ≥ p2
25
26. RELACIÓN ENTRE CARACTERES CUALITATIVOS
AB B1 · · · Bj · · · Bs
A1 O11 · · · O1j · · · O1s O1·
...
...
...
...
...
Ai Oi1 · · · Oij · · · Ois Oi·
...
...
...
...
...
Ar Or1 · · · Orj · · · Ors Or·
O·1 · · · O·j · · · O·s n
(
H0 : A y B son independientes
H1 : A y B son dependientes
Eij =
Oi·O·j
n
, i = 1, 2, . . . , r, j = 1, 2, . . . , s; C =
v
u
u
u
u
u
u
t
P
i,j
O2
ij
Eij
− n
P
i,j
O2
ij
Eij
∗ C toma valores entre 0 y
r
q − 1
q
, con q = m´ın{r, s}
∗ Condiciones:
· Ningún Eij es < 1
· A lo sumo un 20 % de los Eij son < 5
)
V χ2
exp =
P
i,j
O2
ij
Eij
− n
Si χ2
exp < χ2
α((r − 1)(s − 1)) ⇒ H0 : A y B son independientes
∗ χ2
exp =
C2
1 − C2
n
• Tabla 2x2:
φ =
r
(O11O22 − O12O21)2
O1·O2·O·1O·2
∗ φ toma valores entre 0 y 1
∗ Condiciones:
· Todos los marginales Oi· y O·j son > n/10
· Todos los Eij son > 5
∗ χ2
exp = φ2
n
26
27. RELACIÓN ENTRE VARIABLES
X x1 x2 · · · xn
Y y1 y2 · · · yn
Relación Lineal Muestral
Recta de Regresión Muestral:
y = a + bx, donde b =
Sxy
S2
x
, a = ¯y − b¯x, Sxy =
P
i xiyi
n − 1
−
n
n − 1
¯x¯y
Coeficiente de correlación lineal de Person: r =
Sxy
SxSy
Varianza Intrínseca Muestral: s2
=
(n − 1)
(n − 2)
S2
y(1 − r2
)
Relación Lineal Poblacional
(
H0 : ρXY = 0
H1 : ρXY 6= 0
⇒ texp =
s
(n − 2)r2
1 − r2
Si texp < tα(n − 2) ⇒ H0 : ρXY = 0
Recta de Regresión Poblacional: y = α + βx
Intervalos de confianza para α y β:
α ∈ a ± tα(n − 2)s
s
1
n
+
¯x2
(n − 1)S2
x
β ∈ b ± tα(n − 2)
s
p
(n − 1)S2
x
Intervalo de confianza para la recta de regresión poblacional:
α + βx ∈ (a + bx) ± tα(n − 2)s
s
1
n
+
(x − ¯x)2
(n − 1)S2
x
Intervalo de confianza para la predicción de y
y ∈ (a + bx) ± tα(n − 2)s
s
1 +
1
n
+
(x − ¯x)2
(n − 1)S2
x
27
28. ANÁLISIS DE LA VARIANZA: ANOVA
Diseño Completamente Aleatorizado - ANOVA de una vía
Nivel del factor Totales Medias
1 x11 · · · x1n1 x1· ¯x1·
...
...
...
...
...
k xk1 · · · xknk
xk· ¯xk·
x·· ¯x··
n1 + n2 + · · · + nk = n
X
i
X
j
(xij − ¯x··)2
=
X
i
X
j
(¯xi· − ¯x··)2
+
X
i
X
j
(xij − ¯xi·)2
VT = VE + VD
½
H0 : µ1 = · · · = µk
H1 : µi 6= µj, para algún par i, j
TABLA ANOVA
F. de Variación Suma de Cuadrados Grados de Lib. Media Cuadrática F
Entre VE k − 1 MCE = VE/k − 1 Fexp =
MCE
MCD
Dentro VD n − k MCD = VD/n − k
Total VT n − 1
∗ Si Fexp < Fα(k − 1, n − k) ⇒ H0 : µ1 = · · · = µk
Comparaciones Múltiples: Test de Tukey
½
H0 : µi = µj
H1 : µi 6= µj
, 1 ≤ i < j ≤ k
ωij = qα(k, n − k)
s
MCD
2
µ
1
ni
+
1
nj
¶
∗ Si |¯xi· − ¯xj·| < ωij ⇒ H0 : µi = µj
28
29. Diseño por Bloques al azar - ANOVA de dos vías
Nivel del factorBloque B1 · · · Bj · · · Br Totales Medias
1 x11 · · · x1j · · · x1r x1· ¯x1·
...
...
...
...
...
...
i xi1 xij xir xi· ¯xi·
...
...
...
...
...
...
k xk1 · · · xkj · · · xkr xk· ¯xk·
Totales x·1 · · · x·j · · · x·r x·· ¯x··
Medias ¯x·1 · · · ¯x·j · · · ¯x·r
k · r = n
X
i
X
j
(xij − ¯x··)2
=
X
i
X
j
(¯xi· − ¯x··)2
+
X
i
X
j
(¯x·j − ¯x··)2
+
X
i
X
j
(xij − ¯xi· − ¯x·j + ¯x··)2
VT = VE + VB + VD
(1)
½
H0 : µ1 = · · · = µk
H1 : µi 6= µj, para algún par i, j
(2)
½
H0
0 : β1 = · · · = βr = 0
H0
1 : Algún βi 6= 0
TABLA ANOVA
F. de Var. Suma de Cuad. G. L. Media Cuad. F
Entre VE k − 1 MCE = VE/k − 1 Fexp =
MCE
MCD
Bloques VB r − 1 MCB = VB/r − 1
Dentro VD (k − 1)(r − 1) MCD =
VD
(k − 1)(r − 1)
F0
exp =
MCB
MCD
Total VT n − 1
(1) Si Fexp < Fα(k − 1, (k − 1)(r − 1)) ⇒ H0 : µ1 = · · · = µk
(2) Si F0
exp < Fα(r − 1, (k − 1)(r − 1)) ⇒ H0
0 : β1 = · · · = βr = 0
Comparaciones Múltiples: Test LSD
½
H0 : µi = µj
H1 : µi 6= µj
, 1 ≤ i < j ≤ k Tα = tα((k − 1)(r − 1))
r
MCD
2
r
∗ Si |¯xi· − ¯xj·| < Tα ⇒ H0 : µi = µj
Intervalo de Confianza:
µi − µj ∈
Ã
¯xi· − ¯xj· + tα((k − 1)(r − 1))
r
MCD
2
r
!
29