1. 5.4 Modelos de dos factores-tratamiento.
Se continua trabajando con el diseño completamente aleatorizado con dos
factores tratamiento T y T con I y J niveles, respectivamente, y se supone que
las interacciones entre ambos factores son no nulas. Como se explicó en la
sección anterior para poder estimar este modelo es necesario replicar el
experimento. Si se replica K veces el experimento se tienen K unidades
experimentales en cada casilla (tratamiento) ij.
5.4.1 Modelo matemático.
El modelo matemático asociado al diseño de dos factores-tratamiento con
interacción y replicado es el siguiente:
Para cada i = 1,...,I, j = 1,...,J, k = 1,...,K se tiene el siguiente modelo:
con ijk v.a. independientes con distribución N .
(5.22)
Donde,
Y ijk es el resultado del tratamiento i-ésimo, i = 1,2,...,I del factor T y del
tratamiento j-ésimo, j = 1,2,...,ni del factor T , en la replicación t-ésima, t=
1,...,K.
es el efecto global que mide el nivel medio de todos los resultados,
i es el efecto (positivo o negativo) sobre la respuesta debido a que se observa
el nivel i del factor T . Se verifica que i = 1
I
i = 0,
j es el efecto (positivo o negativo) sobre la respuesta debido a que se observa
el nivel j del factor T . Se verifica que j = 1
J
i = 0,
ij representa la interacción y es el efecto extra (positivo o negativo) sobre
la respuesta debido a que se observan conjuntamente los niveles i y jde los
factores T y T respectivamente. Mide la desviación de las medias de la
hipótesis de aditividad de los efectos y viene definida por:
Se verifica que i = 1
I
ij = j = 1
J
ij = 0, para i = 1,...,I; j = 1,...,J.
ijk es el error experimental o perturbación, son variables aleatorias
independientes idénticamente distribuidas (i.i.d.) con distribución N .
2. Por tanto, los parámetros de este modelo son
Parámetros Número
1
i I - 1
j J - 1
ij
2
1
Total IJ + 1
Siendo n = IJK el número de observaciones.
El modelo (5.22)de diseño de experimentos con dos factores tratamiento con
interación se conoce como modelo completo de dos vías o modelo de análisis
de la varianza de dos vías.
Si, ocasionalmente, experimentos similares previos o hechos científicos
contrastados garantizan con una razonable seguridad que ambos factores no
interaccionan, el experimento se modeliza a través de:
con ijk v.a. independientes con distribución N .
(5.23)
El modelo (5.23) es un “submodelo” del modelo completo de dos vías y se
denomina modelo de efectos principales de dos vías o modelo aditivo de dos
víasdado que el efecto sobre la respuesta del tratamiento ij se modeliza como la
suma de los efectos individuales de cada factor. Es importante
Usar el modelo de efectos principales sólo cuando se tiene la certeza de
que no existe interacción entre los factores.
Si no se tiene un conocimiento razonable acerca de la interacción debe
seleccionarse un modelo completo. El motivo es que la inferencia sobre los
efectos principales cuando no se ha considerado interacción erróneamente puede
ser confusa ya que se está incrementando artificialmente el error experimental.
3. La estrategia a seguir es:
1. Si se sospecha que hay interacción, en primer lugar, se contrasta el efecto
de la interacción en un modelo completo de dos vías.
2. Si no resulta significativa, se continúa con el análisis examinando los
efectos principales en el mismo modelo. No es conveniente cambiar al
modelo de efectos principales salvo que se esté muy seguro de la no
existencia de interacción.
3. Si resulta significativo el efecto interacción, entonces los contrastes sobre
los efectos individuales no son válidos. Si son significativos los contrastes
sobre los efectos individuales, los resultados pueden darse por válidos.
Pero si los contrastes son no significativos, los resultados no tienen porque
ser correctos.
Si el efecto interacción es significativo, generalmente es preferible pasar a
un modelo de una vía donde los niveles son todas las combinaciones de
niveles y examinar así sus posibles diferencias.
Otra posibilidad es examinar las diferencias entre niveles de un factor
manteniendo fijos los niveles del otro. En este caso las conclusiones son
correctas para la situación concreta estudiada.
5.4.2 Estimación de los parámetros.
Los parámetros del modelo se obtienen por mínimos cuadrados, técnica que se
basa en minimizar la suma de los cuadrados de los residuos.
(5.24)
proporciona los siguientes estimadores:
4. donde ij. es la media de las observaciones de la casilla ij. El resto de los términos
tiene la interpretación habitual.
La predicción de la casilla ij es la media de los valores de la casilla, por tanto:
(5.25)
Los residuos, diferencia entre lo observado y la predicción,
Los residuos verifican la siguiente restricción (la suma de los residuos en cada
casilla es cero)
por tanto, en cada casilla hay residuos independientes y el número de
grados de libertad es: IJ. Al igual que en los modelos estudiados
previamente se utiliza la varianza residual como estimador de la varianza. Este
estimador viene dado por
(5.26)
5.4.3 Descomposición de la variabilidad
La suma de cuadrados global se puede descomponer de la forma:
6. CUADRO DEL ANÁLISIS DE LA VARIANZA
— MODELO COMPLETO DE DOS VÍAS —
Fuente de
Variación
Suma de
Cuadrados
g.l. scm
Factor F.T scT =
JK i i
2
I-1
scmT =
(scT ) / (I-1)
=
(scmT )
/(scmR)
Factor F.T scT =
IK j j
2
J - 1
scmT =
(scT ) / (J-1)
=
(scmT )
/(scmR)
Inter.
sc =
K i j ij
2
(I -
1)(J -
1)
scm =
(xc ) / ((I-1)(J-1))
=
(scmT )
/(scmR)
Residual
scR =
i j K
e
ijk
2
IJ(K -
1)
scmR =
Global
scG =
i j K
2
IJK -
1
scmG =
Rechazar H0 : ij = 0 i,j
en base al p-valor p = P( < )
Si se acepta H0
( )
entonces
Rechazar H0
( )
: 1 = 2 = ... = I, según p = P( < )
Rechazar H0
( )
: 1 = 2 = ... = J, según p = ( < P )
Si se rechaza H0
( )
entonces considerar el modelo de una vía: Y ijt = ij + ijt
Tabla 5.2. Cuadro del análisis de la varianza para un diseño
completamente aleatorizado y balanceado de dos factores de efectos fijos (modelo
completo).
De este cuadro se deducen los siguientes contrastes:
Si la hipótesis nula H0 : ij = 0, i,j (la interacción no influye) es cierta,
se verifica que
7. (5.27)
se rechaza H0 al nivel de significación si > ,IJ
.
Si se acepta la hipótesis H0 entonces puede contrastarse la influencia de
los dos factores.
Si la hipótesis nula H0
( )
: 1 = 2 = ... = I = 0, (el factor T no influye) es
cierta, se verifica que
(5.28)
se rechaza H0
( )
al nivel de significación si = ( (scmT ) /(scmR) ) >
,IJ .
Si la hipótesis nula H0
( )
: 1 = 2 = ... = J = 0, (el factor T no influye) es
cierta, se verifica que
(5.29)
se rechazaH0
( )
al nivel de significación si = ( (scmT ) /(scmR) ) >
,IJ .
La tabla ANOVA asociada al modelo de efectos principales de dos vías (sin
interacción y con replicación)
8. es la siguiente
CUADRO DEL ANÁLISIS DE LA VARIANZA
— MODELO DE EFECTOS PRINCIPALES DE DOS VÍAS —
Fuente de
Variación
Suma de
Cuadrados
g.l. scm
Factor F.T scT =
JK i i
2
I-1
scmT =
(scT ) / (I-1)
=
(scmT )
/(scmR)
Factor F.T scT =
IK j j
2
J - 1
scmT =
(scT ) / (J-1)
=
(scmT )
/(scmR)
Residual
scR =
i j K
e
ijk
2
IJK -
I - J
+1
scmR =
scR / ( IJK - I -J + 1 )
Global
scG =
i j K
2
IJK -
1
scmG =
Rechazar H0
( )
: 1 = 2 = ... = I, según p = P( < I-1,IJK-I-J+1)
Rechazar H0
( )
: 1 = 2 = ... = J, según p = ( < J-1,IJK-I-J+1)
Tabla 5.3. Cuadro del análisis de la varianza para un diseño
completamente aleatorizado y balanceado de dos factores de efectos fijos sin
interacción.
5.4.4 Análisis de un caso.
En este apartado se desarrolla un problema de diseño de experimentos completo
de dos vías. El enunciado del problema es el siguiente:
Ejemplo 5.3.
“En la tabla adjunta se presentan los tiempos, en minutos, de conexión con una
dirección de internet desde cuatro puntos geográficos de una región y en tres
horas determinadas. El experimento se repetía cuatro veces y era diseñado para
9. estudiar la influencia del factor “hora de conexión” y el factor “lugar de la
conexión” en la variable de interés “tiempo de conexión”.
Analizar estos datos y estudiar la influencia de los dos factores.”
Lugar A Lugar B Lugar C Lugar D
Hora 1 0'
31 0'
45
0'
46 0'
43
0'
82 1'
10
0'
88 0'
72
0'
43 0'
45
0'
63 0'
76
0'
45 0'
71
0'
66 0'
62
Hora 2 0'
36 0'
29
0'
40 0'
23
0'
92 0'
61
0'
49 1'
24
0'
44 0'
35
0'
31 0'
40
0'
56 1'
02
0'
71 0'
38
Hora 3 0'
22 0'
21
0'
18 0'
23
0'
30 0'
37
0'
38 0'
29
0'
23 0'
25
0'
24 0'
22
0'
30 0'
36
0'
31 0'
33
Solución.
Estimación de los parámetros.
Se obtienen las siguientes tablas de medias y estimaciones
L-A L-B L-C L-D i
..
i
H-1 1j
.
0'
413 0'
880 0'
568 0'
610 0'
618 0'
139
H-2 2j
.
0'
320 0'
815 0'
375 0'
667 0'
544 0'
065
H-3 3j
.
0'
210 0'
335 0'
235 0'
325 0'
276 -0'
203
.
.j
.
0'
314 0'
677 0'
393 0'
534
j
-0'
165 0'
198 -0'
086 0'
055 ...
=
0'
479
ij
.
L-A L-B L-C L-D
H-1 -0'
040 0'
064 0'
036 -0'
063
H-2 -0'
059 0'
073 -0'
083 0'
068
H-3 0'
099 -0'
139 0'
045 -0'
006
De donde se deduce la siguiente tabla de residuos:
Residuos Lugar A Lugar B Lugar C Lugar D
Hora 1 -
0'
103
0'
03
7
0'
047 0'
01
7
-
0'
060
0'
220
0'
000 -
0'
160
-
0'
138
-
0'
118
0'
062 0'
192
-0'
160 0'
100
0'
050 0'
010
Hora 2 0'
04
0
-
0'
030
0'
08 -
0'
105 -
0'
205
- 0'
425
0'
065 -
0'
025
- 0'
025
-
0'
107
-
0'
353
0'
043 -
10. 0 0'
090 0'
325 0'
065 0'
287
Hora 3 0'
010 0'
00
0
-
0'
030
0'
02
0
-
0'
035
0'
035
0'
045 -
0'
045
-
0'
005
0'
015
0'
005 -
0'
015
-0'
025 0'
035
-0'
015 0'
005
Tabla ANOVA
Utilizando las estimaciones y residuos obtenidos se obtiene la siguiente tabla
ANOVA
Tabla ANOVA
Fuentes de Suma de Grados de scm p - valor
variación cuadrados libertad
Factor hora 1'
0330 2 0'
5165 23'
222 0'
0000
Factor lugar 0'
9212 3 0'
3071 13'
806 0'
0000
Interacción 0'
2501 6 0'
0417 1'
874 0'
1123
Variab. Exp.
Total
2'
2043 11
Residual 0'
8007 36 0.0222 R =
0'
149
Global 3'
0050 47 0'
0639 Y = 0'
253
De esta tabla se deducen los siguientes contrastes:
[1] El contraste de la hipótesis: “no existe interacción entre los factores T
y T ”. Se realiza por el estadístico
es razonable aceptar la hipótesis de no influencia de la interacción entre
lugar y hora.
[2] El contraste de la hipótesis: “el factor hora no influye”. Se realiza
por el estadístico
11. se rechaza esta hipótesis de no influencia del factor hora.
[3] El contraste de la hipótesis: “el factor lugar no influye”.
se rechaza esta hipótesis de no influencia del factor lugar.
En la Figura 5.6 se representa el gráfico de interacciones que corrobora la no
existencia de interacciones.
Figura 5.6. Gráfico de interacciones.
En la Figura 5.7. se representa el gráfico de residuos frente a predicciones en el
que se observa heterocedasticidad.