DISEÑO DE EXPERIMENTO CON UN FACTOR:
ANÁLISIS DE VARIANZA (ANOVA)
Plan de clases
• Conocimientos previos.
• Conceptos básicos
• Aplicación
Conocimientos previos
• Estadística descriptiva (medidas de tendencia
central)
• Probabilidades
• Prueba de normalidad
• Prueba de homogeneidad de varianzas
• Intervalos de confianza
• Lectura de tabla normal, T de Student y F
Conceptos básicos
• Variable respuestas.- Es la variable cuyos cambios
se desean estudiar (v. dependientes)
• Factor.- Es la variable que controla el investigador
y cuyo efecto sobre la variable dependiente se
desea analizar (v. independiente)
• Niveles del factor.- Son las categorías o valores
que asume la variable independiente.
• Unidad experimental.- Es la unidad expuesta a los
niveles del factor.
Ejemplo 1
vendedores
vendedor 1 vendedor 2 vendedor 3
10 15 20
22 23 24
10 19 10
Se desea comparar las ventas medias realizadas
por tres trabajadores, para ello se selecciona
aleatoriamente tres ventas de cada uno de ellos:
Hipótesis
• Ho: todos los promedios son iguales (las ventas
promedio de los trabajadores son iguales)
• HA: al menos uno de los promedios es
diferente (al menos uno de los trabajadores
realiza ventas diferentes).
vendedores
vendedor 1 vendedor 2 vendedor 3
10 15 20
22 23 24
10 19 10
suma 42 57 54 153
nk 3 3 3 9
promedio 14 19 18 17
vendedores
vendedor 1 vendedor 2 vendedor 3
10 15 20
22 23 24
10 19 10
suma 42 57 54 153
nk 3 3 3 9
promedio 14 19 18 17
SStrat
= 3(14)2
+ 3*(19)2
+ 3*(18)2
- 9 (17)2
= 42
SStotal
= 102
+222
+102
+152
+232
+192
+202
+242
+102
– 9 (17)2
= 274
SSerror
= SStotal
- SStrat
= 274 – 42 = 232
SStrat
= 3(14)2
+3*(19)2
+3*(18)2
- 9 (17)2
= 42
gltrat
= 3-1=2
SStotal
= 102
+222
+102
+152
+232
+192
+202
+242
+102
– 9 (17)2
= 274
gltotal
= 9 -1 =8
SSerror
= SStotal
- SStrat
= 274 – 42 = 232
glerror
= gltotal
- gltrat
= 8 - 2= 6
Fuente de
variación
Suma de
cuadrados gl
Media
cuadrática F
Tratamientos 42 2 21 0.543
error 232 6 38.67
Total 274 8
Decisión
Como F0,05(2, 6)
=5.1433 y como el Fcal=0.543 < 5.1433 se
acepta la hipótesis nula y concluimos que las ventas
promedios de los trabajadores son iguales.
formulas
• Suma de cuadrados de los tratamientos
• Suma de cuadrados del total
• Suma de cuadrados del error
SSerror = SStotal - SStrat
ANOVA con R
Ejemplo
Un analista de mercados quiere saber si tres
tiendas tienen la misma media en compras (en
dólares). Se elige una muestra aleatoria de 6
compras de cada tienda. La siguiente tabla
presenta los datos recolectados. Haga una
prueba ANOVA con una confianza del 95%
para comparar sus medias
Compras por tienda
Tienda 1 Tienda 2 Tienda 3
12.05 15.17 9.48
23.94 18.52 6.92
14.63 19.57 10.47
25.78 21.4 7.63
17.52 13.59 11.9
18.45 20.57 5.92
Hipótesis
• Ho: Las medias de compra de las tres tiendas
son iguales
• HA: al menos una de las medias es diferente
• Como el valor de
p <0.05 se puede
afirmar que al
menos uno de
las medias es
diferente.
Solución usando R
require(stats)
compras=matrix(c(12.05,23.94,14.63,25.78,17.52,18.45,15.17,18.
52,19.57,21.4,13.59,20.57,9.48,6.92,10.47,7.63,11.9,5.92),18,1)
tiendas=matrix(c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3),18,1)
resp <- aov(compras~factor(tiendas))
summary(resp)
posthoc <- TukeyHSD(x=resp,conf.level=0.95)
posthoc
Gracias
• shapiro.test(Ventas)
• Qqnorm(Ventas)

Clase anova