2. A continuación se muestra el uso del análisis de varianza
para probar la igualdad de k medias poblacionales en un
diseño completamente aleatorizado.
3. La forma general de esta prueba de hipótesis es
H 0 : m1 = m2 = mk
H a : no todas la medias poblacionales son iguales
donde
m j = media de la j-esima poblacion
4. Se asume que de cada una de las k poblaciones o
tratamientos se toma una muestra aleatoria simple de
tamaño nj.
5. Para los datos muestrales resultantes, sean
xij = valor de la observacion i del tratamiento j
n j = numero de observaciones en el tratamiento j
x j = media muestral del tratamiento j
s 2 = varianza muestral del tratamiento j
j
s j = desviacion estandar muestral del tratamiento j
6. Las fórmulas para la media y la varianza muestral del
tratamiento j son las siguientes
nj nj
å xij å (xij - x j )2
xj = i=1
s 2j = i=1
nj n j -1
7. La media muestral general, es la suma de todas las
observaciones divididas entre la cantidad total de
observaciones, es decir
k nj
åå x ij
x= j=1 i=1
nT
donde nT = n1 + n2 ++ nk
8. Si el tamaño de cada muestra es n, la ecuación anterior se
reduce a k
åx j
x= j=1
k
En otras palabras, si todas las muestras son del mismo
tamaño, la media muestral general es el promedio de las k
medias muestrales.
9. En el experimento de Chemitech, como todas las muestras
constaban de n=5 observaciones, la media muestral general
está dada por
62 + 66 + 52
x= = 60
3
Si la hipótesis nula es verdadera, la media muestral general
es la mejor estimación de la media poblacional.
10. Estimación de la varianza
poblacional entre tratamientos
A la estimación de s 2 entre tratamientos también se le
llama cuadrado medio debido a los tratamientos y se
denota como CMTR. La fórmula general para calcularlo es
k
å n j (x j - x )2
CMTR = j=1 (1)
k -1
11. Al numerador de la ecuación (1) se le llama suma de
cuadrados debido a los tratamientos y se denota por
SCTR. El denominador, k-1, representa los grados de
libertad asociados con la SCTR.
12. Si H0 es verdadera, el CMTR proporciona una estimación
insesgada de s 2 . No obstante, si las medias de las k
poblaciones no son iguales, el CMTR sobreestima a s 2 .
13. Para los datos de Chemitech obtenemos los siguientes
resultados
SCTR = 5(62 - 60)2 + 5(66 - 60)2 + 5(52 - 60)2 = 520
520
CMTR =
2
14. Estimación de la varianza
poblacional dentro de los
tratamientos
A la estimación de s 2 dentro de los tratamientos también
se le llama cuadrado medio debido al error y se denota
como CME. La fórmula general para calcularlo es
k
å (n j -1)s 2
j
CME = j=1
(2)
nT - k
15. Al numerador de la ecuación (2) se le llama suma de
cuadrados debido al error y se denota por SCE. El
denominador, nT-k, representa los grados de libertad
asociados con la SCE.
16. El que H0 sea o no verdadera no tiene ninguna influencia,
por lo que el CME proporciona siempre una estimación
insesgada de s 2 .
17. Para los datos de Chemitech obtenemos los siguientes
resultados
SCE = (5-1)27.5+ (5-1)26.5+(5-1)31= 340
340
CME = = 28.33
12
18. Comparación de las
estimaciones de las varianzas:
la prueba F
Si la hipótesis nula es verdadera y se satisfacen los
supuestos del ANOVA, la distribución muestral del
CMTR/CME es una distribución F con k-1 grados de
libertad en el numerador y nT-k grados de libertad en el
denominador.
19. PRUEBA DE IGUALDAD DE k MEDIAS POBLACIONALES
H 0 : m1 = m2 == mk = 0
H a : no todas las medias poblacionales son iguales
ESTADISTICO DE PRUEBA
CMTR
F= (3)
CME
20. REGLA DE RECHAZO
Metodo del valor critico: Rechazar H0 si F ³ Fa
donde Fa pertenece a la distribución F con k-1 grados de
libertad en el numerador y nT-k grados de libertad en el
denominador.
21. Ahora bien, en el experimento de Chemitech se usará
como nivel de significancia a = 0.05 , para realizar la
prueba de hipótesis. En este caso el valor del estadístico de
prueba es
260
F= = 9.18
28.33
22. Con a = 0.05 utilizamos la siguiente tabla para calcular el
valor de F0.05 , considerando 2 grados de libertad en el
numerador y 12 en el denominador, de modo que
F0.05 = 3.89
23.
24. Como F ³ F0.05 , H0 es rechazada y concluimos que las
medias de las tres poblaciones no son iguales.
25. Tabla de ANOVA
Los cálculos anteriores se pueden presentar de manera
adecuada en un instrumento conocido como tabla de
análisis de varianza o tabla de ANOVA. En la siguiente
figura se observa la forma general de una tabla ANOVA
para un diseño completamente aleatorizado.