1. Introducción ANOVA de un factor
Estadística III
Segunda Lectura
David Medina
ITSPe
David Medina ITSPe
Estadística III Segunda Lectura
2. Introducción ANOVA de un factor
Outline
Introducción
ANOVA
ANOVA de un factor
Introducción
Suposiciones e hipótesis
Modelo de ANOVA para un solo factor
Variabilidad
Resumen
David Medina ITSPe
Estadística III Segunda Lectura
3. Introducción ANOVA de un factor
ANOVA
ANOVA
El Análisis de varianza (ANOVA) es un método de prueba de
igualdad de tres o más medias poblacionales, por medio del
análisis de las varianzas de las medias muestrales.
David Medina ITSPe
Estadística III Segunda Lectura
4. Introducción ANOVA de un factor
Introducción
Diseño completamente al azar
De k poblaciones se seleccionan muestras aleatorias de
tamaño n. Las k poblaciones diferentes se clasifican con base
en un criterio único, como tratamientos o grupos diferentes.
Un tratamiento se utiliza para designar a agregados, analistas,
fertilizadores, regiones de un pais, etc.
David Medina ITSPe
Estadística III Segunda Lectura
5. Introducción ANOVA de un factor
Suposiciones e hipótesis
Suposiciones
Se supone que las k poblaciones son independientes y están
distribuidas en forma normal con medias µ1, µ2, . . . , µk y
varianza común σ2.
Se desean obtener métodos adecuados para probar la
hipótesis
H0 : µ1 = µ2 = · · · = µk
H1 : al menos dos de las medias no son iguales.
David Medina ITSPe
Estadística III Segunda Lectura
6. Introducción ANOVA de un factor
Suposiciones e hipótesis
Suposiciones
Sea que yij denote la j-ésima observación del i-ésimo
tratamiento, y el acomodo de los datos es el que se observa en
la tabla siguiente. Aquí Yij es el total de todas las
observaciones de la muestra, del i-ésimo tratamiento, ¯yi. es la
media de todas las observaciones en la muestra del i-ésimo
tratamiento, Y.. es el total de todas las nk observaciones, y ¯y..
es la media de todas las nk observaciones.
David Medina ITSPe
Estadística III Segunda Lectura
7. Introducción ANOVA de un factor
Suposiciones e hipótesis
Suposiciones
Tratamiento 1 2 . . . i . . . k
y11 y21 . . . yi1 . . . yk1
y12 y22 . . . yi2 . . . yk2
...
...
...
...
y1n y2n . . . yin . . . ykn
Total Y1. Y2. . . . Yi. . . . Yk. Y..
Media ¯y1. ¯y2. . . . ¯yi. . . . ¯yk. ¯y..
David Medina ITSPe
Estadística III Segunda Lectura
8. Introducción ANOVA de un factor
Modelo de ANOVA para un solo factor
Modelo
Cada observación puede escribirse en la forma
Yij = µi + ij,
donde ij mide la desviación que tiene la observación j-ésima
de la i-ésima muestra, con respecto de la media del tratamiento
correspondiente.
David Medina ITSPe
Estadística III Segunda Lectura
9. Introducción ANOVA de un factor
Variabilidad
Variabilidad total en componentes
La prueba se basará en una combinación de dos estimadores
independientes a través de
k
i=1
n
j=1
(yij − ¯y..)2
.
Esto se hace mediante la siguiente identidad
k
i=1
n
j=1
(yij − ¯y..)2
= n
k
i=1
(¯yi. − ¯y..)2
+
k
i=1
n
j=1
(yij − ¯yi.)2
.
David Medina ITSPe
Estadística III Segunda Lectura
10. Introducción ANOVA de un factor
Variabilidad
Variabilidad total en componentes
Estas cantidades se identifican por:
SST =
k
i=1
n
j=1
(yij − ¯y..)2
.
SSA = n
k
i=1
(¯yi. − ¯y..)2
.
y
SSE =
k
i=1
n
j=1
(yij − ¯yi.)2
.
David Medina ITSPe
Estadística III Segunda Lectura
11. Introducción ANOVA de un factor
Variabilidad
Variabilidad total en componentes
La media cuadrática del tratamiento está dada por:
s2
1 =
SSA
k − 1
.
El error cuadrático medio es
s2
=
SSE
k(n − 1)
.
David Medina ITSPe
Estadística III Segunda Lectura
12. Introducción ANOVA de un factor
Variabilidad
Variabilidad total en componentes
Sea
f =
s2
1
s2
.
Entonces con un nivel de significancia α, se rechaza la
hipótesis nula cuando
f > fα[k − 1, k(n − 1)],
fα[k − 1, k(n − 1)] es la distribución F con k − 1 y n(k − 1)
grados de libertad.
David Medina ITSPe
Estadística III Segunda Lectura
13. Introducción ANOVA de un factor
Variabilidad
Variabilidad total en componentes
Otro enfoque es a través del valor P:
Si P[f[k − 1, k(n − 1)] > f] ≤ α rechace la hipótesis nula.
David Medina ITSPe
Estadística III Segunda Lectura
14. Introducción ANOVA de un factor
Resumen
Resumen
F. V. S. C. G. L. M. C. f calculada
Tratamientos SSA k − 1 s2
1 = SSA
k−1
s2
1
s2
Error SSE k(n − 1) s2 = SSE
k(n−1)
Total SST k(n − 1)
F. V. Fuente de variación.
S. C. Suma de cuadrados.
G. L. Grados de libertad.
M. C. Media cuadrática.
David Medina ITSPe
Estadística III Segunda Lectura