El documento presenta los conceptos fundamentales del análisis de varianza (ANOVA), incluyendo la variación entre grupos, la variación dentro de los grupos, y cómo se relacionan a través de la razón F. Explica cómo calcular las sumas de cuadrados totales, entre grupos y dentro de grupos, y cómo utilizar estas sumas para calcular las medias cuadráticas entre grupos y dentro de grupos, lo que permite comparar la variación entre los grupos con la variación dentro de los grupos de manera estandarizada.
2. Introducción
• En el capítulo anterior se analizaron
únicamente dos grupos, sin embargo, la
realidad es usualmente más compleja que eso.
• Frecuentemente se requiere comparar
tres, cuatro, cinco o más muestras de grupos.
• No es posible emplear la razón t para
comparar por pares dichas muestras, ya que
implicaría gran trabajo y errores (alpha), por
ello existe el ANÁLISIS DE VARIANZA.
3. La lógica del análisis de varianza
• Para efectuar dicho análisis se requieren dos
conceptos:
– VARIACIÓN DENTRO DE LOS GRUPOS: Es la
distancia entre los puntajes crudos y su media del
grupo.
– VARIACIÓN ENTRE GRUPOS: La distancia entre las
medias de los grupos.
4. La lógica del análisis de varianza
• Dichas variaciones se pueden relacionar con la prueba de la
razón t, así:
X1 X 2 Variación entre grupos
t
dif Variación dentro de los grupos
• Este análisis de varianza produce una razón F, cuyo numerador
indica la variación entre los grupos, y cuyo denominador
representa la variación dentro de los grupos.
5. La sumas de cuadrados
• Este concepto se empleó al obtener la desviación
estándar, cuando se elevaron al cuadrado las
desviaciones de la media de una distribución.
Dicho procedimiento eliminaba de manera
matemática sólida, los signos negativos que
pudieran existir.
• Existen distintas sumas de cuadrados:
– SCTotal: Suma de cuadrados total.
– SCent: Suma de cuadrados entre grupos.
– SCdentro: Suma de cuadrados dentro de los grupos.
6. La suma de cuadrados dentro de los
grupos (SCdentro)
• Por fórmula:
SCdentro X12 X 2 X 3 X 4
2 2 2
• Donde:
• X=Un puntaje de desviación (X-X)
• APLICANDO LA FÓRMULA PARA LOS
SIGUIENTES DATOS:
• X1= 1,2,1,2
• X2= 1,3,2,2
9. La suma de cuadrados entre los grupos
(SCent)
• La suma de cuadrados entre los grupos
representa la suma de las desviaciones de cada
media muestral de la media total elevadas al
cuadrado.
• Por fórmula: SCent ( X X total ) 2
N
• Donde:
X=cualquier media muestral
Xtotal= la media total (la media de los puntajes crudos
de la totalidad de las muestras combinadas)
N=el número de puntajes de cualquier muestra
SCent=la suma de cuadrados entre los grupos.
11. La suma total de cuadrados (SCtotal)
• La suma total de cuadrados es igual a la
combinación de sus componentes dentro
y entre los grupos.
• Por fórmula:
• SCTotal= SCent + SCdentro
• SCTotal= 0.48 + 6.48
• SCTotal= 6.96
12. La suma total de cuadrados (SCtotal)
• También se puede hallar con la fórmula:
• Donde: SCtotal ( X X total ) 2
• X=un puntaje crudo en cualquier muestra.
• Xtotal= la media total (la media de todos los puntajes
crudos de todas las muestras combinadas).
• SCTotal=la suma total de cuadrados.
• Se suman todas las desviaciones al cuadrado con
respecto de la media total. Ver pág. 71.
13. Cómo calcular las suma de cuadrados
• Los procedimientos anteriores son en
extremos tardados y difíciles, por ello existen
fórmulas más simples para calcular las sumas
de cuadrados.
( Xtotal )
2
SCtotal X total
2
N .total
• Donde:
• N total=el número total de puntajes de todas
las muestras combinadas.
16. La suma de cuadrados entre los grupos
(SCent)
• En nuestro caso:
( X ) 2 ( Xtotal)
2
SCent
• Donde: N Ntotal
=A la sumatoria de los puntajes de cada
( X ) muestra al cuadrado.
2
( Xtotal) = A la sumatoria de todos los puntajes al
2
cuadrado.
• N=el número total de puntajes en cualquier muestra.
• N total= el número total de puntajes en todas las
muestras combinadas.
18. La suma de cuadrados dentro los
grupos (SCdentro)
• Se puede calcular por simple despeje:
SCtotal SCdentro SCent
SCdentro SCtotal SCent
SCdentro 7.00 0.50
SCdentro 6.50
20. La media cuadrática
• La suma de cuadrados tiende a crecer conforme
aumenta N, por lo cual, dichas medidas no se
pueden considerar “puras”. Por ello, se requiere
un medio de control que evite esto.
• Para eso existe la “media cuadrática”. Por
fórmula: SCent
Cent
• Donde: glent
Cent =la media cuadrática entre los grupos.
SCent = la suma de cuadrados entre los grupos.
glent =los grados de libertad entre los grupos.
21. La media cuadrática
Y también: SCdentro
Cdentro
gldentro
Donde:
Cdentro = la media cuadrática dentro de los
grupos.
SCdentro = la suma de cuadrados dentro de
los grupos.
gldentro = los grados de libertad dentro de los
grupos.
22. La media cuadrática
• Pero primero hay que obtener los grados de
libertad apropiados:
• Para la media cuadrática entre los grupos:
glent= K-1
Donde: K= el número de muestras.
Para encontrar la media cuadrática dentro de los
grupos.
gldentro= N total – K
Donde: N total= el número total de puntajes en
todas las muestras combinadas.
K= el número de muestras.
23. La media cuadrática
• Sustituyendo con los datos anteriores:
glent= K-1
glent= 4-1
glent=3
Para encontrar la media cuadrática dentro de los
grupos.
gldentro= N total – K
gldentro= 16-4
gldentro= 12
24. La media cuadrática
• Ahora solo falta obtener las medias
cuadráticas:
SCent SCdentro
Cent Cdentro
glent gldentro
0.50 6.50
Cent Cdentro
3 12
Cent 0.17 Cdentro 0.54
25. Razón o cociente F
• El análisis de varianza produce una razón f que
sirve para comparar la variación entre los grupos
y dentro de los grupos.
• Por fórmula: F
SCent
Cdentro
• Para los datos vistos: 0.17
F F 0.31
0.54
• Ahora estamos listos para rechazar o para aceptar
la hipótesis nula. (Con la tabla D).
26. Razón o cociente F
• La tabla D se interpreta, para el numerador
(glent: grados de libertad entre) se indican en
la parte superior de la tabla; el denominador
(gldentro) se indican al lado izquierdo.
• Para nuestro caso:
– glent =3
– gldentro =12
• Así se encuentra un valor de: 3.49.
27. Razón o cociente F
• Así que la razón F de la tabla fue de 3.49.
• Y la razón F calculada fue de 0.31
• Por lo tanto la razón F calculada, debe ser igual o
mayor que la de la tabla para rechazar la
hipótesis nula; sin embargo, en este caso como
fue de solo 0.31, debemos aceptar que no hay
diferencias significativas entre los grupos y se
acepta la hipótesis nula.
• PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).
28. Comparación múltiple de medias
• Con el fin de averiguar dónde se encuentran
exactamente las diferencias significativas
entre los grupos, cuando F obtenida, es igual o
mayor que la F de la tabla, se emplea una
nueva prueba, a saber: la DSH (Honestly
significant difference: diferencia
honestamente significartiva) de Turkey.
29. Comparación múltiple de medias
• Por fórmula: Cdentro
DSH qa
n
• Donde:
qa = un valor de la tabla a un nivel
de confianza dado para el número máximo de
medias que se estén comparando.
Cdentro = la media cuadrática dentro de
los grupos.
n= el número de entrevistados en
cada grupo (debe ser el mismo).
30. Comparación múltiple de medias
• Paso 3: Encontrar la DSH.
Cdentro DSH 3.77 8.67
DSH qa
n
43 .37 DSH 3.77(2.94)
DSH 3.77
5 DSH 11.08
43 .37
DSH 3.77
5
• Paso 4: Comparar la DSH con la tabla de las
diferencias entre medias.
31. Comparación múltiple de medias
• Para que se le considere estadísticamente
significativa, cualquier diferencia entre medias
debe ser igual o mayor que la DSH.
• Por lo tanto se concluye las diferencias entre
X1 y X3; X2 y X3, son estadísticamente
significativas;
• No así entre X1 y X2, que solo es de 11.0,
menor que 11,08 obtenido en el paso 3.
32. Comparación múltiple de medias
• En tu equipo, analicen el ejemplo y resuelvan
un ejercicio asociado (número 5 ó 7).
• REALICEN LOS PROBLEMAS DE LAS PÁGINAS:
83-85.