1. PARA UN FACTOR (ONE WAY)
ANALISIS DE VARIANZA
(ANOVA)
Por: Flores (2018)
2. El análisis de varianza (ANOVA) permite
comparar dos o más medias en forma
indirecta mediante la comparación directa
de sus respectivas varianzas.
El ANOVA es una técnica paramétrica
mediante la cual, la variación total presente
en un conjunto de datos, se divide en sus
componentes, y asociada a cada una de ellas,
hay una fuente específica de variación, de
modo que, en el análisis es posible averiguar
la magnitud de las contribuciones de cada
una de estas fuentes sobre la variación
total.
3. Supuestos
Los k (k= número de grupos) conjuntos de
datos observados forman k nuestras
aleatorias simples a partir de las
poblaciones respectivas.
Cada una de las poblaciones de las que se
extraen las muestras siguen una
distribución normal con media µj y varianza
j
2
Cada una de las poblaciones tienen la misma
varianza. Es decir, 2
1 = 2
2 = …= 2
k= 2 ,
varianza común.
3
4. ANOVA: UN FACTOR O UNA VIA
Ejemplo. Un docente universitario está
interesado en evaluar la efectividad de tres
tratamientos para mejorar la creatividad en
estudiantes. Para tal efecto considera una
muestra de 14 estudiantes de 1er ciclo de
estudios. Cada estudiante es asignado en
forma aleatoria a cada uno de tres
tratamientos (A,B y C), de modo tal que en
cada tratamiento se tienen 5, 5 y 4
estudiantes, respectivamente.
El incremento de puntajes en creatividad se
presentan a continuación:
5. Tratamiento
Total: 18 26 12 56
Si los datos siguen la distribución normal,
¿Los tratamientos tienen la misma
efectividad en la mejora de la Creatividad?
V. dep.: creatividad de cada estudiante
V. indep.:Tratamiento (V. Cualitativa: A,
B, C)
A B C
5 6 3
4 5 2
2 4 4
4 5 3
3 6
6. Veamos las medias aritméticas y desviaciones
estándar de las disminuciones de rpm según
tratamiento:
Tratamiento
A B C total
Media 3,6 5,2 3,0 4,0
Desv.Est. 1,14 0,84 0,82 1,30
n 5 5 4 14
Se observa que con el tratamiento B el
incremento de pje promedio de creatividad fue
mayor y con el C fue menor (Gráfico 1).
Esto a un nivel descriptivo; pero, ¿existe
diferencia estadísticamente significativa entre
los tres tratamientos respecto al pje de
creatividad promedio?
7. En el gráfico 1 se observa que la disminución
promedio de pje Creatividad es mayor en los
niños que han recibido el tratamiento B y la
disminución más baja se da en los que han
recibido el tratamiento C.
1 2 3
3
4
5
Dieta
Disminución
Main Effects Plot - Data Means for Disminución
8. Definición de términos:
1. Tratamiento: Es cualquier diferencia
manifestada en la forma en que se clasifican
las muestras. En este caso, este término no
siempre se usa en el sentido usual de la
palabra, sino su uso es más general. Por
ejemplo, si se desea estudiar la repuesta al
mismo tratamiento ( en el sentido usual de la
palabra) de tres grupos de personas
distintos. Sin embargo, nos referiríamos al
grupo de personas como el “tratamiento”.
2. Unidad experimental (u.e.): Viene a ser el
objeto al que se aplica un tratamiento o
procedimiento, o bien un miembro de una
población específica.
9. La estructura de la técnica del análisis de
varianza tiene que ver con el diseño de
experimento.
A continuación se presentan los datos
obtenidos en un diseño completamente
aleatorizado (DCA) en el que se han
comparado k tratamientos; es decir se tiene
un esquema de datos para realizar un
ANOVA para un factor:
10. TRATAMIENTO
1 2... k
x11 x12 ... x1k
x21 x22 ... x2k
. ... .
. ... .
xn11 xn22 ... xnkk
• Total: T.1 T.2 ... T.k
• Número de unidades por tratamiento:
n1 n2... nk
• Donde el gran total de valores es:
T.. = T.1 + T.2 +... + T.k,
• El número total de datos es:
N = n1 + n2 + ... + nk
11. Prueba de hipótesis
Hipótesis: Ho: 1 =2=... =k
H1: al menos dos medias de
tratamientos son diferentes
Nivel de significación: = 0,05
Estadística de Prueba:
La estadística de prueba es el ANOVA.
La variabilidad total se descompone en las
siguientes fuentes de variación:
12. • Variabilidad total = Variabilidad entre
grupos + Variabilidad dentro de grupos.
• Cuantificando cada de una de las fuentes,
se tienen las siguientes sumas de
cuadrados:
• SCT = SCE + SCD
Grados de libertad que corresponde a cada
fuente:
N-1 = k-1 + N-k
13. Donde:
SCT = x²ij - T..²
N
SCE = T².1 + T².2 + ... + T².k - T²..
n1 n2 nk N
SCD = SCT - SCE
14. Los resultados de los cálculos anteriores se
resumen en la siguiente,
TABLA ANOVA
Donde la razón de varianzas (RV) o F calculado
tiene distribución F de Snedecor o Fisher, con
(k-1) grados de libertad en el numerador y (N-k)
en el denominador, si Ho es verdadera.
Fuente de variación G.L. S.C. C.M. R.V. (F) Valor de p
Entre Grupos K - 1 SCE CME F=CME/CMD Tabla o Cómputo
Dentro de Grupos N - k SCD CMD
Total N - 1 SCT CMT
15. Respecto al ejemplo planteado, se tiene:
Hipótesis
Ho : A = B = C (Los tratamientos no difieren
en cuanto a su efectividad)
H1 : Al menos dos medias son diferentes.
(Al menos dos tratamientos difieren en
cuanto a su efectividad)
Nivel de significación: = 0,05
Estadística de Prueba: ANOVA un factor
Cálculos:
SCT = (5²+4²+2²+...+4²+3²) – (56)²/14 =22
SCE = (18²/5 +26²/5 + 12²/4) – (56)²/14=12
SCD= SCT – SCE = 22 – 12 =10
16. One-way Analysis of Variance
Analysis of Variance for Diminution
Fuente de GL Suma de Cuadrado Razón de Valor de
Variación Cuadrados medio varianzas p
Tratam. 2 12,000 6,000 F =6,60 0,013
Error 11 10,000 0,909
Total 13 22,000
La razón de varianzas F= 6,60 tiene una distribución F(2,11), y la probabilidad
de cometer el error tipo I es p = 0,013, (obtenido con computadora) y siendo
p < 0,05, se rechaza Ho.
Se concluye que, en cuanto a efectividad, dos tratamientos por lo menos
difieren.
Igual decisión (rechazar H0) se toma cuando Fc > Ft (6,60 > 3,98), donde Fc es
F calculado y Ft es F tabulado para = 0,05 con 2 y 11 grados de libertad.
Si se rechaza H0, en el ANOVA, se aplica una prueba de comparaciones
múltiples o prueba post hoc (Tukey, Scheffé, etc) para determinar entre qué
pares de medias existe diferencia.
17. Toma de decisión
17
F tab. = 3,98
Fcal=6,60
= 0,05
Zona de rechazo
Zona de no rechazo de Ho
Distribución F
18. PRUEBA DE SCHEFFÉ
Se calcula :
Y F = Ft(k – 1).
Si, F > F , se concluye que los tratamientos
1 y 2 difieren significativamente.
Apliquemos la prueba para comparar los
tratamientos A y B, teniendo:
x1= 3,6 x2= 5,2 CMD= 0,909 n1= 5 n2=
5
19. Reemplazando:
F = 7,04, y,
F = 3,98(2)
F = 7,96, siendo F < F, se concluye
que los tratamientos A y B no difieren en cuanto
a sus efectos