1. Cap´ıtulo 1
Pruebas de comparaciones
m´ultiples
En este cap´ıtulo, se presentan diferentes pruebas de comparaci´on m´ultiple
con el fin de tomar decisiones, una vez la hip´otesis general sobre igualdad
de medias (o efectos) de tratamientos ha sido rechazada.
1.1. Pruebas de comparaciones m´ultiples
Siempre que los resultados del an´alisis de varianza conduzcan a rechazar
la hip´otesis nula de no diferencia entre las medias poblacionales, surge la
pregunta respecto a qu´e tratamiento es el “mejor”, lo cual es de inter´es
en el caso de un modelo de efectos fijos como el presentado con el caso de
DCA. De hecho lo que con frecuencia se desea saber, aunque no siempre,
es qu´e grupos de tratamientos son iguales a trav´es de la realizaci´on de una
prueba en todas las comparaciones de cada uno de los pares de tratamientos.
El experimentador debe tener precauci´on al pretender encontrar diferencias
significativas entre las medias individuales, siempre asegurarse que su pro-
cedimiento de comparaci´on sea v´alido. Aunque la probabilidad 𝛼 (fijado con
anterioridad), de rechazar una hip´otesis nula verdadera para la prueba co-
mo un todo es peque˜na, la probabilidad de rechazar al menos una hip´otesis
verdadera cuando se prueban varios pares de medias es mayor de 𝛼.
1
2. 2 CAP´ITULO 1. PRUEBAS DE COMPARACIONES M´ULTIPLES...
1.1.1. Conceptos preliminares
Sea un experimento con 𝑡 tratamientos y medias poblacionales 𝜇1, 𝜇2, . . . , 𝜇𝑡;
sea una combinaci´on lineal de las medias 𝐿 =
𝑡∑
𝑖=1
𝑎𝑖𝜇𝑖, tal que
𝑡∑
𝑖=1
𝑎𝑖 = 0, es
decir un contraste.
Sean ¯𝑦1▪, ¯𝑦2▪, . . . , ¯𝑦𝑡▪ las medias muestrales obtenidas a partir de estas 𝑡 mues-
tras independientes de tama˜nos 𝑛1, 𝑛2, . . . , 𝑛𝑡, respectivamente. Sobre los
supuestos de distribuci´on normal de los residuos y varianzas iguales, se tiene
que:
i) ˆ𝐿 =
𝑡∑
𝑖=1
𝑎𝑖 ¯𝑦𝑖▪ encontr´andose adem´as que 𝐸(ˆ𝐿) = 𝐿.
ii) 𝑉 (ˆ𝐿) = 𝜎2
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
y ˆ𝑉 (ˆ𝐿) = 𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
.
iii) ˆ𝐿 ∼ 𝑁(𝐿, 𝑉 (ˆ𝐿)).
iv) Dos contrastes
𝐿1 =
𝑡∑
𝑖=1
𝑎𝑖1𝜇𝑖 y 𝐿2 =
𝑡∑
𝑖=1
𝑎𝑖2𝜇𝑖,
cuyos estimadores son ˆ𝐿1 =
𝑡∑
𝑖=1
𝑎𝑖1 ¯𝑦𝑖▪ y ˆ𝐿2 =
𝑡∑
𝑖=1
𝑎𝑖2 ¯𝑦𝑖▪ respectivamente,
se dicen que son ortogonales si la covarianza entre ellos es nula, es decir
si se satisface
𝑡∑
𝑖=1
𝑎𝑖1𝑎𝑖2/𝑛𝑖 = 0.
1.1.2. Procedimientos de comparaciones m´ultiples
Si el inter´es es comparar todas las parejas de las 𝑡 medias de los tratamientos,
es decir, se desea probar 𝐻0 : 𝜇𝑖 = 𝜇𝑖′ para toda 𝑖 ∕= 𝑖′, 𝑖, 𝑖′ = 1, . . . , 𝑡;
existen en la literatura estad´ıstica muchos m´etodos que permiten hacer estas
comparaciones, se destacan a continuaci´on algunos de ´estos.
1. Prueba t de Student
3. 1.1. PRUEBAS DE COMPARACIONES M´ULTIPLES 3
Suponga que se tiene inter´es en el contraste 𝐿 =
𝑡∑
𝑖=1
𝑎𝑖𝜇𝑖 teniendo en
cuenta los grados de libertad del residuo (𝑔𝑙𝑒) y que 𝐶𝑀𝐸
𝜎2 ∼ 𝜒2
(𝑔𝑙𝑒) y,
por la independencia de este con las ¯𝑦𝑖▪(𝑖 = 1, . . . , 𝑡) entonces,
ˆ𝐿 − 𝐿
√
𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
∼ 𝑡(𝑔𝑙𝑒)
De donde para un contraste particular:
𝑃𝑟
⎡
⎣ˆ𝐿 − 𝑡(𝑔𝑙𝑒,𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
≤ 𝐿 ≤ ˆ𝐿 + 𝑡(𝑔𝑙𝑒;𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
⎤
⎦ = 1 − 𝛼
Si se tiene en cuenta en la hip´otesis: 𝐻0 : 𝐿 = 0 se rechaza con un
nivel de significancia de 𝛼 si
∣ˆ𝐿∣ > 𝑡(𝑔𝑙𝑒;𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
en caso contrario se tendr´a evidencia estad´ıstica para no rechazar la
hip´otesis de inter´es.
2. M´etodo de Scheff´e
Scheffe (1953), demuestra que para la totalidad de los contrastes 𝐿;
𝑃𝑟
[
ˆ𝐿 − 𝐹0𝑆0 ≤ 𝐿 ≤ ˆ𝐿 + 𝐹0𝑆0
]
= 1 − 𝛼
donde
𝐹0 =
√
(𝑡 − 1)𝐹(𝑡−1;𝑔𝑙𝑒;𝛼) 𝑦 𝑆0 =
√
ˆ𝑉 (ˆ𝐿) = ⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
4. 4 CAP´ITULO 1. PRUEBAS DE COMPARACIONES M´ULTIPLES...
si se plantea la hip´otesis 𝐻0 : 𝐿 = 0, se rechaza a un nivel significancia
𝛼 si
∣ˆ𝐿∣ ≥ 𝐹0𝑆0
Por otro lado, si 𝐿1 y 𝐿2 son contrastes ortogonales se observa en ?
que sobre ciertas condiciones
(ˆ𝐿1 − ˆ𝐿2)𝑡
(𝑉 (ˆ𝐿1−ˆ𝐿2)
𝜎2
𝑒
)
(ˆ𝐿1 − ˆ𝐿2)
(𝑡 − 1)𝐶𝑀𝐸
∼ 𝐹(𝑡−1;𝑔𝑙𝑒).
Donde ˆ𝐿1 y ˆ𝐿2 son contrastes los cuales estiman a 𝐿1 y 𝐿2, respec-
tivamente, en el espacio de las 𝑡-medias, 𝑉 (ˆ𝐿1 − ˆ𝐿2) es la matriz de
varianzas y covarianzas de ˆ𝐿1 − ˆ𝐿2.
Consecuentemente la regi´on de confianza de tama˜no (1 − 𝛼), es un
elipsoide donde el di´ametro m´aximo es tal que
𝑃𝑟
[
∣𝐿1 − 𝐿2∣ ≤
√
(𝑡 − 1)𝐹(𝑡−1;𝑔𝑙𝑒;𝛼)𝐶𝑀𝐸
]
= 1 − 𝛼.
Se observa que el m´etodo est´a basado en el di´ametro m´aximo que re-
presenta la direcci´on de un contraste particular de varianza m´axima.
3. M´etodo de Bonferroni (Fisher)
Este m´etodo fue usado por primera vez por Fisher (1935) y origin´o la
desigualdad de Bonferroni que tiene la siguiente base: “Para un con-
junto de 𝑚 contrastes, si cada uno es probado con un coeficiente de
confianza de 1−𝛼, el coeficiente de confianza conjunto es por lo menos
1 − 𝑚𝛼”.
El m´etodo de Bonferroni para comparaciones m´ultiples es adecuado
para probar 𝑚 contrastes y consiste en aplicar la prueba 𝑡-student a
cada uno de los contrastes usando un nivel de significancia 𝛼/𝑚, con
eso queda garantizado que el coeficiente de confianza conjunta es 1−𝛼.
5. 1.1. PRUEBAS DE COMPARACIONES M´ULTIPLES 5
Si dos intervalos de confianza de una misma muestra para los con-
trastes 𝐿1 y 𝐿2 se obtienen; sean los eventos 𝐴1 : El evento correspon-
diente al complemento del intervalo de confianza para 𝐿1 y 𝐴2 : En
forma an´aloga pero para 𝐿2 con 𝑃𝑟(𝐴1) = 𝑃𝑟(𝐴2) = 𝛼.
Se sabe que: 𝑃𝑟(𝐴1 ∪ 𝐴2) = 𝑃𝑟(𝐴1) + 𝑃𝑟(𝐴2) − 𝑃𝑟(𝐴1 ∩ 𝐴2) entonces
𝑃𝑟[(𝐴1 ∪ 𝐴2)𝑐] = 1 − 𝑃𝑟(𝐴1 ∪ 𝐴2). Adem´as, por la desigualdad de
Boole: 𝑃𝑟(𝐴1 ∪ 𝐴2) ≤ 𝑃𝑟(𝐴1) + 𝑃𝑟(𝐴2), entonces 𝑃𝑟(𝐴𝑐
1 ∩ 𝐴𝑐
2) ≥
1 − 𝑃𝑟(𝐴1) − 𝑃𝑟(𝐴2) = 1 − 2𝛼, el cual corresponde, en este caso, al
evento regi´on de confianza conjunta para 𝐿1 y 𝐿2.
En el caso general de la cobertura de 𝑚 eventos se satisface que
𝑃𝑟
⎛
⎝
𝑚∩
𝑗=1
𝐴𝑐
𝑗
⎞
⎠ ≥ 1 − 𝑚𝛼.
Observaci´on 1.1. Cuando mayor sea el n´umero de contrastes 𝑚;
menor es el nivel de significancia para cada contraste particular; luego
esta prueba se debe usar cuando 𝑚 no es muy grande.
La hip´otesis 𝐻0 : 𝐿 = 0, se rechaza a un nivel de significancia 𝛼 si
∣ˆ𝐿∣ > 𝑡(𝑔𝑙𝑒;𝜀/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
con 𝜀 = 2𝛼
𝑝(𝑝−1) cuando se comparan 𝑝 medias de tratamientos.
4. M´etodo basado en la amplitud m´axima
La distribuci´on de las diferencias entre el mayor y el menor estad´ısti-
cos de orden del conjunto de las medias muestrales constituye la base
de este m´etodo .
Al considerar que ¯𝑦𝑖▪ es una variable aleatoria correspondiente a la
media muestral, la cual se distribuye en forma normal, la distancia
6. 6 CAP´ITULO 1. PRUEBAS DE COMPARACIONES M´ULTIPLES...
𝑄 =
𝑀𝑎𝑥(¯𝑦𝑖▪) − 𝑀𝑖𝑛(¯𝑦𝑖▪)
√
𝐶𝑀𝐸/𝑟
= 𝑀𝑎𝑥1≤𝑖≤𝑖′≤𝑡
(
∣¯𝑦𝑖▪ − ¯𝑦𝑖′▪∣
√
𝐶𝑀𝐸/𝑟
)
se le denomina la amplitud m´axima estandarizada o estudentizada
(rango estudentizado) con par´ametros 𝑡 y 𝑔𝑙𝑒.
La distribuci´on de esta estad´ıstica se encuentra tabulada para varios
valores de 𝛼, es decir, existen tablas para valores 𝑞(𝑡;𝑔𝑙𝑒;𝛼) (ver tabla
correspondiente), tales que
𝑃𝑟
[
𝑄 ≤ 𝑞(𝑡;𝑔𝑙𝑒;𝛼)
]
= 1 − 𝛼.
Por lo tanto, se rechaza la hip´otesis 𝐻0 : 𝐿 = 0, si 𝑄 > 𝑞(𝑡;𝑔𝑙𝑒;𝛼).
Observaci´on 1.2. La prueba 𝑡-student y de Bonferroni para contraste
de dos medias pueden ser vistas como un caso particular de aplicaci´on
de la amplitud estudentizada.
5. M´etodo de Tukey
Tukey(1953) propuso un m´etodo de comparaci´on m´ultiple que tam-
bi´en est´a basado en los intervalos o regiones de confianza. Este es
usado para comparar la totalidad de las
(𝑡
2
)
contrastes de medias de
tipo 𝐿 = 𝜇𝑖 − 𝜇𝑖′ , 1 ≤ 𝑖 ≤ 𝑖′ ≤ 𝑡.
Si se considera que 𝑛1 = ⋅ ⋅ ⋅ = 𝑛𝑡 = 𝑟 se demuestra que 1 − 𝛼 es
la probabilidad de que las 𝑡(𝑡 − 1)/2 comparaciones de dos medias
satisfagan simult´aneamente la condici´on
(¯𝑦𝑖▪ − ¯𝑦𝑖′▪) ±
√
𝐶𝑀𝐸
𝑟
𝑞(𝑡;𝑔𝑙𝑒;𝛼)
siendo 𝑞(𝑡;𝑔𝑙𝑒;𝛼) el valor correspondiente en la tabla apropiada.
Luego con un nivel de significancia 𝛼 el estad´ıstico de prueba para
la hip´otesis 𝐻0 : 𝜇𝑖 = 𝜇𝑖′ contra 𝐻𝑎 : 𝜇𝑖 ∕= 𝜇𝑖′ , esta dado por
Δ =
√
𝐶𝑀𝐸
𝑟 𝑞(𝑡;𝑔𝑙𝑒;𝛼).
Si ∣ˆ𝐿∣ = ∣ˆ𝜇𝑖 − ˆ𝜇𝑖′ ∣ > Δ se rechaza 𝐻0.
7. 1.1. PRUEBAS DE COMPARACIONES M´ULTIPLES 7
Observaci´on 1.3. La prueba de Tukey exige en principio balancea-
miento.
6. M´etodo de Newman-Keuls (N-K)
Esta prueba fue dise˜nada por Newman(1939) y modificada por Keuls
(1952), quien gener´o un nuevo inter´es en la prueba de Newman y por
ello el procedimiento se conoce como la prueba de Newman-Keuls.
Esta prueba es un procedimiento secuencial basado en la amplitud es-
tandariza y es v´alido para la totalidad de contrastes de dos medias
como en los m´etodos anteriores.
Se exige la condici´on de balanceamiento es decir 𝑛1 = ⋅ ⋅ ⋅ = 𝑛𝑡 = 𝑟, y
el estad´ıstico 𝑄 se estudia con par´ametros 𝑝 y 𝑔𝑙𝑒, con 𝑝 el n´umero de
medias ordenadas cubiertas por el contraste en estudio.
En la aplicaci´on de la prueba se siguen los siguientes pasos:
a) Ordenar las medias en un orden creciente o decreciente.
b) Se compara la mayor media (𝑝′ = 𝑝) con la menor. Para esa
comparaci´on se determina
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛼) y la estimaci´on del
contraste; si el valor
𝑁𝐾𝑝 =
√
𝐶𝑀𝐸
𝑟
𝑞(𝑝′;𝑔𝑙𝑒;𝛼) > ∣ˆ𝐿∣
las medias son cubiertas por una subl´ınea que permite determinar
o afirmar que no hay diferencias significativas entre ellas. En el
caso contrario se hace el siguiente paso.
c) Se reduce una unidad el valor de 𝑝′ calcul´andose de nuevo el va-
lor de 𝐶𝑀𝐸, es decir
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛼) y para todos los pares de
medias que no est´en cubiertos por una misma l´ınea y que cubren
𝑝′ medias, se repite el proceso de comparaci´on.
d) Se repite c) hasta que 𝑝′ = 1.
8. 8 CAP´ITULO 1. PRUEBAS DE COMPARACIONES M´ULTIPLES...
Observaci´on 1.4. Esta prueba tiene como inconveniente el hecho que
como las medias ordenadas no son independientes, el valor de 𝑞(𝑝′;𝑔𝑙𝑒;𝛼)
no es exacto.
Nota:
i) La prueba de N-K es un procedimiento secuencial v´alido para la
totalidad de los contrastes de dos medias.
ii) N-K exige en principio balanceamiento.
iii) N-K es una prueba aproximada.
7. M´etodo de Duncan
Constituye tambi´en un procedimiento secuencial v´alido para la com-
paraci´on del contraste de dos medias. La prueba est´a basada en la am-
plitud estudentizada, 𝑞(𝑝′;𝑔𝑙𝑒;𝛼). En este caso, tanto 𝑝′ como 𝛼 var´ıan
durante la aplicaci´on de la prueba; 𝑝′ es el n´umero de medias ordenadas
cubiertas por el contraste en estudio y 𝛼 es el nivel de significancia con-
siderado en cada paso de aplicaci´on de la prueba.
Para un contraste sobre 𝑝 medias ordenadas el valor de 𝛼 es igual a
1 − (1 − 𝛼)𝑝−1.
Los pasos para la aplicaci´on de la prueba estad´ıstica son los mismos
que los de N-K, solo que los valores del contraste son comparados con
𝐷 =
√
𝐶𝑀𝐸
𝑟
𝑞(𝑝′;𝑔𝑙𝑒;𝛾𝑝)
𝛾𝑝 = 1 − (1 − 𝛼)𝑝−1 es el nivel de significancia, tomado como si se
incluyeran 𝑝 − 1 contrastes ortogonales en cada paso y cada valor de
𝐷 es calculado como si las medias fueran independientes, pero como
est´an ordenadas no van a ser independientes.
La regla de decisi´on es rechazar 𝐻0 si ∣¯𝑦𝑖▪ − ¯𝑦𝑖′▪∣ ≥
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛾𝑝).
9. 1.1. PRUEBAS DE COMPARACIONES M´ULTIPLES 9
Teniendo como casos particulares
Prueba t 𝑝′ = 2 𝛼′ = 𝛼
Prueba de Bonfer-
roni
𝑝′ = 2 𝛼′ = 𝛼/𝑚
Prueba de Tukey 𝑝′ = 𝑝 𝛼′ = 𝛼
Prueba N-K 𝑝′ = 𝑝, 𝑝 − 1, . . . , 2 𝛼′ = 𝛼
Prueba de Duncan 𝑝′ = 𝑝, 𝑝 − 1, . . . , 2 𝛼′ = 1 − (1 − 𝛼)𝑝′
8. M´etodo de Dunnett
Dunnet(1955), desarrolla un procedimiento para comparar un trata-
miento control (testigo) con otros tratamientos.
Sea 𝜇𝑇 y 𝜇𝑖 (𝑖 = 1, 2, . . . , 𝑡) las medias poblacionales del control y
de los dem´as 𝑝 = 𝑡 − 1 tratamientos y, 𝑛𝑇 y 𝑛𝑖 las correspondientes
replicaciones.
Para la totalidad de los contrastes 𝐿 = 𝜇𝑖 − 𝜇𝑇 , se tiene que
𝑃𝑟
[
∣𝐿 − ˆ𝐿∣ < 𝑑(𝑝;𝑔𝑙𝑒;𝛼)
√(
1
𝑛𝑖
+
1
𝑛𝑇
)
𝐶𝑀𝐸
]
= 1 − 𝛼
Con un nivel 𝛼 de significancia se rechaza 𝐻0 si
∣¯𝑦𝑖▪ − ¯𝑦𝑇▪∣ ≥ 𝑑(𝑝;𝑔𝑙𝑒;𝛼)
√(
1
𝑛𝑖
+
1
𝑛𝑇
)
𝐶𝑀𝐸
Observaci´on 1.5. Es conveniente usar m´as observaciones en el trata-
miento control que en los otros tratamientos.
En la tabla de Dunnett se presenta los valores cr´ıticos para la prueba
de Dunnett asociados a algunos valores de 𝛼 (𝑑(𝑝;𝑔𝑙𝑒;𝛼)).
1.1.2.1. Algunos comentarios sobre comparaciones m´ultiples
Las pruebas de Tukey y de Duncan tienen bases muy semejantes, sin em-
bargo, la prueba de Duncan da diferencias significativas con m´as facilidad,
ya que al formular un nivel de significancia del 5 % la probabilidad de que
un contraste incluya dos medias exige una probabilidad del 95 % de que no
10. 10 CAP´ITULO 1. PRUEBAS DE COMPARACIONES M´ULTIPLES...
se encuentre significancia en una diferencia realmente nula, para el caso de
tres medias la probabilidad ser´a de (0, 95)2, en el caso de 𝑡 medias la proba-
bilidad ser´a de (0,95)𝑡−1; en tanto que la prueba de Tukey es m´as exigente,
mantiene siempre una probabilidad de (0, 95) de no encontrar significancia
en una diferencia realmente nula entre todas las medias de los tratamientos.
La prueba de Duncan aplicada ampliamente no es muy rigurosa, por lo cual
debe ser usada con mucha cautela. As´ı la prueba de Duncan es un interme-
dio entre el excesivo rigor de la prueba de Tukey y la falta de rigor de la
prueba 𝑡-student.
La prueba de Scheff´e es a´un m´as rigurosa, no es recomendable para la com-
paraci´on de dos medias, pero puede usarse en contrastes m´as amplios (de
m´as de dos medias), ´esta es m´as poderosa que el m´etodo de Bonferroni si
el n´umero de comparaciones es relativamente m´as grande que el n´umero de
media