Capítulo III
Análisis de varianza
Introducción
• En el capítulo anterior se analizaron
únicamente dos grupos, sin embargo, la
realidad es usualmente más compleja que eso.
• Frecuentemente se requiere comparar tres,
cuatro, cinco o más muestras de grupos.
• No es posible emplear la razón t para
comparar por pares dichas muestras, ya que
implicaría gran trabajo y errores (alpha), por
ello existe el ANÁLISIS DE VARIANZA.
La lógica del análisis de varianza
• Para efectuar dicho análisis se requieren dos
conceptos:
– VARIACIÓN DENTRO DE LOS GRUPOS: Es la
distancia entre los puntajes crudos y su media del
grupo.
– VARIACIÓN ENTRE GRUPOS: La distancia entre las
medias de los grupos.
La lógica del análisis de varianza
• Dichas variaciones se pueden relacionar con la prueba de la
razón t, así:
• Este análisis de varianza produce una razón F, cuyo numerador
indica la variación entre los grupos, y cuyo denominador
representa la variación dentro de los grupos.
dif
XX
t

21 

Variación entre grupos
Variación dentro de los grupos
La sumas de cuadrados
• Este concepto se empleó al obtener la desviación
estándar, cuando se elevaron al cuadrado las
desviaciones de la media de una distribución.
Dicho procedimiento eliminaba de manera
matemática sólida, los signos negativos que
pudieran existir.
• Existen distintas sumas de cuadrados:
– SCTotal: Suma de cuadrados total.
– SCent: Suma de cuadrados entre grupos.
– SCdentro: Suma de cuadrados dentro de los grupos.
La suma de cuadrados dentro de los
grupos (SCdentro)
• Por fórmula:
• Donde:
• X=Un puntaje de desviación (X-X)
• APLICANDO LA FÓRMULA PARA LOS
SIGUIENTES DATOS:
• X1= 1,2,1,2
• X2= 1,3,2,2
  2
4
2
3
2
2
2
1 XXXXSCdentro
La suma de cuadrados dentro de los
grupos (SCdentro)
CONSERVADORES (N=4) MODERADOS (N=4)
X1 X=X-X X2 X2 X=X-X X2
1 -0.50 0.25 1 -1.00 1
2 0.50 0.25 3 1.00 1
1 -0.50 0.25 2 0 0
2 0.50 0.25 2 0 0
61 X
5.1
4
6
X
00.12
1 X 82 X
0.2
4
8
X
00.22
2 X
La suma de cuadrados dentro de los
grupos (SCdentro)
LIBERALES (N=4) RADICALES (N=4)
X3 X=X-X X2 X4 X=X-X X2
1 -0.75 0.56 3 1.25 1.56
2 0.25 0.06 2 0.25 0.06
2 -0.25 0.06 1 -0.75 0.56
2 0.25 0.06 1 -0.75 0.56
71 X
75.1
4
7
X
74.02
3 X 72 X
75.1
4
7
X
74.22
4 X
  2
4
2
3
2
2
2
1 XXXXSCdentro
74.274.000.200.1 SCdentro
48.6SCdentro
La suma de cuadrados entre los grupos
(SCent)
NSCent totalXX 2)( 

• La suma de cuadrados entre los grupos
representa la suma de las desviaciones de cada
media muestral de la media total elevadas al
cuadrado.
• Por fórmula:
• Donde:
X=cualquier media muestral
Xtotal= la media total (la media de los puntajes crudos
de la totalidad de las muestras combinadas)
N=el número de puntajes de cualquier muestra
SCent=la suma de cuadrados entre los grupos.
La suma de cuadrados entre los grupos
(SCent)
• SCent= (1.50-1.75)2 4 + (2.0-1.75) 2 4 +
(1.75-1.75)2 4 + (1.75-1.75) 2 4
• SCent= (-0.25)2 4 + (0.25) 2 4 + (0)2 4 + (0) 2 4
• SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4
• SCent= 0.24+ 0.24
• SCent= 0.48
La suma total de cuadrados (SCtotal)
• La suma total de cuadrados es igual a la
combinación de sus componentes dentro
y entre los grupos.
• Por fórmula:
• SCTotal= SCent + SCdentro
• SCTotal= 0.48 + 6.48
• SCTotal= 6.96
La suma total de cuadrados (SCtotal)
• También se puede hallar con la fórmula:
• Donde:
• X=un puntaje crudo en cualquier muestra.
• Xtotal= la media total (la media de todos los puntajes
crudos de todas las muestras combinadas).
• SCTotal=la suma total de cuadrados.
• Se suman todas las desviaciones al cuadrado con
respecto de la media total. Ver pág. 71.
 

2)( totalXX
SCtotal
Cómo calcular las suma de cuadrados
• Los procedimientos anteriores son en
extremos tardados y difíciles, por ello existen
fórmulas más simples para calcular las sumas
de cuadrados.
• Donde:
• N total=el número total de puntajes de todas
las muestras combinadas.
totalN
Xtotal
totalXSCtotal
.
)( 2
2  
Cómo calcular las suma de cuadrados
CONSERVADORES (N=4) MODERADOS (N=4)
X1 X2 X2 X2
1 1 1 1
2 4 3 9
1 1 2 4
2 4 2 4
61 X
5.1
4
6
X
82 X
0.2
4
8
X
182
2 X102
1 X
Cómo calcular las suma de cuadrados
(SCtotal)
LIBERALES (N=4) RADICALES (N=4)
X3 X2 X4 X2
1 1 3 9
2 4 2 4
2 4 1 1
2 4 1 1
71 X
75.1
4
7
X
132
3 X 72 X
75.1
4
7
X
152
4 X
4444
)7786(
)15131810(
2


SCtotal
16
)28(
)56(
2
SCtotal
16
784
)56( SCtotal 4956SCtotal 7SCtotal
totalN
Xtotal
totalXSCtotal
.
)( 2
2  
La suma de cuadrados entre los grupos
(SCent)
Ntotal
Xtotal
N
X
SCent
22
)()(   









• En nuestro caso:
• Donde:
= A la sumatoria de los puntajes de cada
muestra al cuadrado.
= A la sumatoria de todos los puntajes al
cuadrado.
• N=el número total de puntajes en cualquier muestra.
• N total= el número total de puntajes en todas las
muestras combinadas.
 2
)( X
2
)(Xtotal
La suma de cuadrados entre los grupos
(SCent)
Ntotal
Xtotal
N
X
SCent
22
)()(   









• Sustituyendo:
16
)28(
4
)7(
4
)7(
4
)8(
4
)6( 22222
SCent
16
784
4
49
4
49
4
64
4
36
SCent
4925.1225.12169 SCent
495.49 SCent
50.0SCent
La suma de cuadrados dentro los
grupos (SCdentro)
SCentSCdentroSCtotal 
• Se puede calcular por simple despeje:
SCentSCtotalSCdentro 
50.000.7 SCdentro
50.6SCdentro
La suma de cuadrados dentro los
grupos (SCdentro)








   
N
X
XSCdentro
2
2 )(
)(
• Solo para verificar en busca de errores:

























4
)7(
15
4
)7(
13
4
)8(
18
4
)6(
10
2222
SCdentro

















4
49
15
4
49
13
4
64
18
4
36
10SCdentro
       25.121525.12131618910 SCdentro
75.275.021 SCdentro
50.6SCdentro
La media cuadrática
• La suma de cuadrados tiende a crecer conforme
aumenta N, por lo cual, dichas medidas no se
pueden considerar “puras”. Por ello, se requiere
un medio de control que evite esto.
• Para eso existe la “media cuadrática”. Por
fórmula:
• Donde:
=la media cuadrática entre los grupos.
SCent = la suma de cuadrados entre los grupos.
glent =los grados de libertad entre los grupos.
glent
SCent
Cent 
Cent
La media cuadrática
Y también:
Donde:
= la media cuadrática dentro de los
grupos.
SCdentro = la suma de cuadrados dentro de
los grupos.
gldentro = los grados de libertad dentro de los
grupos.
gldentro
SCdentro
Cdentro 
Cdentro
La media cuadrática
• Pero primero hay que obtener los grados de
libertad apropiados:
• Para la media cuadrática entre los grupos:
glent= K-1
Donde: K= el número de muestras.
Para encontrar la media cuadrática dentro de los
grupos.
gldentro= N total – K
Donde: N total= el número total de puntajes en
todas las muestras combinadas.
K= el número de muestras.
La media cuadrática
• Sustituyendo con los datos anteriores:
glent= K-1
glent= 4-1
glent=3
Para encontrar la media cuadrática dentro de los
grupos.
gldentro= N total – K
gldentro= 16-4
gldentro= 12
La media cuadrática
• Ahora solo falta obtener las medias
cuadráticas:
glent
SCent
Cent 
3
50.0
Cent
17.0Cent
gldentro
SCdentro
Cdentro 
12
50.6
Cdentro
54.0Cdentro
Razón o cociente F
• El análisis de varianza produce una razón f que
sirve para comparar la variación entre los grupos
y dentro de los grupos.
• Por fórmula:
• Para los datos vistos:
• Ahora estamos listos para rechazar o para aceptar
la hipótesis nula. (Con la tabla D).
Cdentro
SCent
F


54.0
17.0
F 31.0F
Razón o cociente F
• La tabla D se interpreta, para el numerador
(glent: grados de libertad entre) se indican en
la parte superior de la tabla; el denominador
(gldentro) se indican al lado izquierdo.
• Para nuestro caso:
– glent =3
– gldentro =12
• Así se encuentra un valor de: 3.49.
Razón o cociente F
• Así que la razón F de la tabla fue de 3.49.
• Y la razón F calculada fue de 0.31
• Por lo tanto la razón F calculada, debe ser igual o
mayor que la de la tabla para rechazar la
hipótesis nula; sin embargo, en este caso como
fue de solo 0.31, debemos aceptar que no hay
diferencias significativas entre los grupos y se
acepta la hipótesis nula.
• PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).
Comparación múltiple de medias
• Con el fin de averiguar dónde se encuentran
exactamente las diferencias significativas
entre los grupos, cuando F obtenida, es igual o
mayor que la F de la tabla, se emplea una
nueva prueba, a saber: la DSH (Honestly
significant difference: diferencia
honestamente significartiva) de Turkey.
Comparación múltiple de medias
• Por fórmula:
• Donde:
qa = un valor de la tabla a un nivel
de confianza dado para el número máximo de
medias que se estén comparando.
= la media cuadrática dentro de
los grupos.
n= el número de entrevistados en
cada grupo (debe ser el mismo).
n
Cdentro
qaDSH


Cdentro
Comparación múltiple de medias
• Paso 1: Construir una tabla de diferencias entre
medias ordenadas. (Ver pág. 77).
• Paso 2: Encontrar qa en la tabla I. (Primero
verificando en la columna los gl, y en los
renglones K (el mayor número de medias).
(X3 )=97.0 (X2 )=114.4 (X1 )=125.4
(X3 ) - 17.4 28.4
(X2 ) - - 11.0
(X1 ) - - -
Comparación múltiple de medias
• Paso 3: Encontrar la DSH.
• Paso 4: Comparar la DSH con la tabla de las
diferencias entre medias.
n
Cdentro
qaDSH


5
37.43
77.3DSH
5
37.43
77.3DSH
67.877.3DSH
)94.2(77.3DSH
08.11DSH
Comparación múltiple de medias
• Para que se le considere estadísticamente
significativa, cualquier diferencia entre medias
debe ser igual o mayor que la DSH.
• Por lo tanto se concluye las diferencias entre
X1 y X3; X2 y X3, son estadísticamente
significativas;
• No así entre X1 y X2, que solo es de 11.0,
menor que 11,08 obtenido en el paso 3.
Comparación múltiple de medias
• En tu equipo, analicen el ejemplo y resuelvan
un ejercicio asociado (número 5 ó 7).
• REALICEN LOS PROBLEMAS DE LAS PÁGINAS:
83-85.

168046869 s3-capitulo-iii-analisis-de-varianza

  • 1.
  • 2.
    Introducción • En elcapítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso. • Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos. • No es posible emplear la razón t para comparar por pares dichas muestras, ya que implicaría gran trabajo y errores (alpha), por ello existe el ANÁLISIS DE VARIANZA.
  • 3.
    La lógica delanálisis de varianza • Para efectuar dicho análisis se requieren dos conceptos: – VARIACIÓN DENTRO DE LOS GRUPOS: Es la distancia entre los puntajes crudos y su media del grupo. – VARIACIÓN ENTRE GRUPOS: La distancia entre las medias de los grupos.
  • 4.
    La lógica delanálisis de varianza • Dichas variaciones se pueden relacionar con la prueba de la razón t, así: • Este análisis de varianza produce una razón F, cuyo numerador indica la variación entre los grupos, y cuyo denominador representa la variación dentro de los grupos. dif XX t  21   Variación entre grupos Variación dentro de los grupos
  • 5.
    La sumas decuadrados • Este concepto se empleó al obtener la desviación estándar, cuando se elevaron al cuadrado las desviaciones de la media de una distribución. Dicho procedimiento eliminaba de manera matemática sólida, los signos negativos que pudieran existir. • Existen distintas sumas de cuadrados: – SCTotal: Suma de cuadrados total. – SCent: Suma de cuadrados entre grupos. – SCdentro: Suma de cuadrados dentro de los grupos.
  • 6.
    La suma decuadrados dentro de los grupos (SCdentro) • Por fórmula: • Donde: • X=Un puntaje de desviación (X-X) • APLICANDO LA FÓRMULA PARA LOS SIGUIENTES DATOS: • X1= 1,2,1,2 • X2= 1,3,2,2   2 4 2 3 2 2 2 1 XXXXSCdentro
  • 7.
    La suma decuadrados dentro de los grupos (SCdentro) CONSERVADORES (N=4) MODERADOS (N=4) X1 X=X-X X2 X2 X=X-X X2 1 -0.50 0.25 1 -1.00 1 2 0.50 0.25 3 1.00 1 1 -0.50 0.25 2 0 0 2 0.50 0.25 2 0 0 61 X 5.1 4 6 X 00.12 1 X 82 X 0.2 4 8 X 00.22 2 X
  • 8.
    La suma decuadrados dentro de los grupos (SCdentro) LIBERALES (N=4) RADICALES (N=4) X3 X=X-X X2 X4 X=X-X X2 1 -0.75 0.56 3 1.25 1.56 2 0.25 0.06 2 0.25 0.06 2 -0.25 0.06 1 -0.75 0.56 2 0.25 0.06 1 -0.75 0.56 71 X 75.1 4 7 X 74.02 3 X 72 X 75.1 4 7 X 74.22 4 X   2 4 2 3 2 2 2 1 XXXXSCdentro 74.274.000.200.1 SCdentro 48.6SCdentro
  • 9.
    La suma decuadrados entre los grupos (SCent) NSCent totalXX 2)(   • La suma de cuadrados entre los grupos representa la suma de las desviaciones de cada media muestral de la media total elevadas al cuadrado. • Por fórmula: • Donde: X=cualquier media muestral Xtotal= la media total (la media de los puntajes crudos de la totalidad de las muestras combinadas) N=el número de puntajes de cualquier muestra SCent=la suma de cuadrados entre los grupos.
  • 10.
    La suma decuadrados entre los grupos (SCent) • SCent= (1.50-1.75)2 4 + (2.0-1.75) 2 4 + (1.75-1.75)2 4 + (1.75-1.75) 2 4 • SCent= (-0.25)2 4 + (0.25) 2 4 + (0)2 4 + (0) 2 4 • SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4 • SCent= 0.24+ 0.24 • SCent= 0.48
  • 11.
    La suma totalde cuadrados (SCtotal) • La suma total de cuadrados es igual a la combinación de sus componentes dentro y entre los grupos. • Por fórmula: • SCTotal= SCent + SCdentro • SCTotal= 0.48 + 6.48 • SCTotal= 6.96
  • 12.
    La suma totalde cuadrados (SCtotal) • También se puede hallar con la fórmula: • Donde: • X=un puntaje crudo en cualquier muestra. • Xtotal= la media total (la media de todos los puntajes crudos de todas las muestras combinadas). • SCTotal=la suma total de cuadrados. • Se suman todas las desviaciones al cuadrado con respecto de la media total. Ver pág. 71.    2)( totalXX SCtotal
  • 13.
    Cómo calcular lassuma de cuadrados • Los procedimientos anteriores son en extremos tardados y difíciles, por ello existen fórmulas más simples para calcular las sumas de cuadrados. • Donde: • N total=el número total de puntajes de todas las muestras combinadas. totalN Xtotal totalXSCtotal . )( 2 2  
  • 14.
    Cómo calcular lassuma de cuadrados CONSERVADORES (N=4) MODERADOS (N=4) X1 X2 X2 X2 1 1 1 1 2 4 3 9 1 1 2 4 2 4 2 4 61 X 5.1 4 6 X 82 X 0.2 4 8 X 182 2 X102 1 X
  • 15.
    Cómo calcular lassuma de cuadrados (SCtotal) LIBERALES (N=4) RADICALES (N=4) X3 X2 X4 X2 1 1 3 9 2 4 2 4 2 4 1 1 2 4 1 1 71 X 75.1 4 7 X 132 3 X 72 X 75.1 4 7 X 152 4 X 4444 )7786( )15131810( 2   SCtotal 16 )28( )56( 2 SCtotal 16 784 )56( SCtotal 4956SCtotal 7SCtotal totalN Xtotal totalXSCtotal . )( 2 2  
  • 16.
    La suma decuadrados entre los grupos (SCent) Ntotal Xtotal N X SCent 22 )()(             • En nuestro caso: • Donde: = A la sumatoria de los puntajes de cada muestra al cuadrado. = A la sumatoria de todos los puntajes al cuadrado. • N=el número total de puntajes en cualquier muestra. • N total= el número total de puntajes en todas las muestras combinadas.  2 )( X 2 )(Xtotal
  • 17.
    La suma decuadrados entre los grupos (SCent) Ntotal Xtotal N X SCent 22 )()(             • Sustituyendo: 16 )28( 4 )7( 4 )7( 4 )8( 4 )6( 22222 SCent 16 784 4 49 4 49 4 64 4 36 SCent 4925.1225.12169 SCent 495.49 SCent 50.0SCent
  • 18.
    La suma decuadrados dentro los grupos (SCdentro) SCentSCdentroSCtotal  • Se puede calcular por simple despeje: SCentSCtotalSCdentro  50.000.7 SCdentro 50.6SCdentro
  • 19.
    La suma decuadrados dentro los grupos (SCdentro)             N X XSCdentro 2 2 )( )( • Solo para verificar en busca de errores:                          4 )7( 15 4 )7( 13 4 )8( 18 4 )6( 10 2222 SCdentro                  4 49 15 4 49 13 4 64 18 4 36 10SCdentro        25.121525.12131618910 SCdentro 75.275.021 SCdentro 50.6SCdentro
  • 20.
    La media cuadrática •La suma de cuadrados tiende a crecer conforme aumenta N, por lo cual, dichas medidas no se pueden considerar “puras”. Por ello, se requiere un medio de control que evite esto. • Para eso existe la “media cuadrática”. Por fórmula: • Donde: =la media cuadrática entre los grupos. SCent = la suma de cuadrados entre los grupos. glent =los grados de libertad entre los grupos. glent SCent Cent  Cent
  • 21.
    La media cuadrática Ytambién: Donde: = la media cuadrática dentro de los grupos. SCdentro = la suma de cuadrados dentro de los grupos. gldentro = los grados de libertad dentro de los grupos. gldentro SCdentro Cdentro  Cdentro
  • 22.
    La media cuadrática •Pero primero hay que obtener los grados de libertad apropiados: • Para la media cuadrática entre los grupos: glent= K-1 Donde: K= el número de muestras. Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K Donde: N total= el número total de puntajes en todas las muestras combinadas. K= el número de muestras.
  • 23.
    La media cuadrática •Sustituyendo con los datos anteriores: glent= K-1 glent= 4-1 glent=3 Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K gldentro= 16-4 gldentro= 12
  • 24.
    La media cuadrática •Ahora solo falta obtener las medias cuadráticas: glent SCent Cent  3 50.0 Cent 17.0Cent gldentro SCdentro Cdentro  12 50.6 Cdentro 54.0Cdentro
  • 25.
    Razón o cocienteF • El análisis de varianza produce una razón f que sirve para comparar la variación entre los grupos y dentro de los grupos. • Por fórmula: • Para los datos vistos: • Ahora estamos listos para rechazar o para aceptar la hipótesis nula. (Con la tabla D). Cdentro SCent F   54.0 17.0 F 31.0F
  • 26.
    Razón o cocienteF • La tabla D se interpreta, para el numerador (glent: grados de libertad entre) se indican en la parte superior de la tabla; el denominador (gldentro) se indican al lado izquierdo. • Para nuestro caso: – glent =3 – gldentro =12 • Así se encuentra un valor de: 3.49.
  • 27.
    Razón o cocienteF • Así que la razón F de la tabla fue de 3.49. • Y la razón F calculada fue de 0.31 • Por lo tanto la razón F calculada, debe ser igual o mayor que la de la tabla para rechazar la hipótesis nula; sin embargo, en este caso como fue de solo 0.31, debemos aceptar que no hay diferencias significativas entre los grupos y se acepta la hipótesis nula. • PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).
  • 28.
    Comparación múltiple demedias • Con el fin de averiguar dónde se encuentran exactamente las diferencias significativas entre los grupos, cuando F obtenida, es igual o mayor que la F de la tabla, se emplea una nueva prueba, a saber: la DSH (Honestly significant difference: diferencia honestamente significartiva) de Turkey.
  • 29.
    Comparación múltiple demedias • Por fórmula: • Donde: qa = un valor de la tabla a un nivel de confianza dado para el número máximo de medias que se estén comparando. = la media cuadrática dentro de los grupos. n= el número de entrevistados en cada grupo (debe ser el mismo). n Cdentro qaDSH   Cdentro
  • 30.
    Comparación múltiple demedias • Paso 1: Construir una tabla de diferencias entre medias ordenadas. (Ver pág. 77). • Paso 2: Encontrar qa en la tabla I. (Primero verificando en la columna los gl, y en los renglones K (el mayor número de medias). (X3 )=97.0 (X2 )=114.4 (X1 )=125.4 (X3 ) - 17.4 28.4 (X2 ) - - 11.0 (X1 ) - - -
  • 31.
    Comparación múltiple demedias • Paso 3: Encontrar la DSH. • Paso 4: Comparar la DSH con la tabla de las diferencias entre medias. n Cdentro qaDSH   5 37.43 77.3DSH 5 37.43 77.3DSH 67.877.3DSH )94.2(77.3DSH 08.11DSH
  • 32.
    Comparación múltiple demedias • Para que se le considere estadísticamente significativa, cualquier diferencia entre medias debe ser igual o mayor que la DSH. • Por lo tanto se concluye las diferencias entre X1 y X3; X2 y X3, son estadísticamente significativas; • No así entre X1 y X2, que solo es de 11.0, menor que 11,08 obtenido en el paso 3.
  • 33.
    Comparación múltiple demedias • En tu equipo, analicen el ejemplo y resuelvan un ejercicio asociado (número 5 ó 7). • REALICEN LOS PROBLEMAS DE LAS PÁGINAS: 83-85.