Pruebas comparaciones multiples1unidad_ii_ia

Cap´ıtulo 1
Pruebas de comparaciones
múltiples
En este cap´ıtulo, se presentan diferentes pruebas de comparación múltiple
con el fin de tomar decisiones, una vez la hipótesis general sobre igualdad
de medias (o efectos) de tratamientos ha sido rechazada.
1.1. Pruebas de comparaciones múltiples
Siempre que los resultados del análisis de varianza conduzcan a rechazar
la hipótesis nula de no diferencia entre las medias poblacionales, surge la
pregunta respecto a qué tratamiento es el “mejor”, lo cual es de interés
en el caso de un modelo de efectos fijos como el presentado con el caso de
DCA. De hecho lo que con frecuencia se desea saber, aunque no siempre,
es qué grupos de tratamientos son iguales a través de la realización de una
prueba en todas las comparaciones de cada uno de los pares de tratamientos.
El experimentador debe tener precaución al pretender encontrar diferencias
significativas entre las medias individuales, siempre asegurarse que su pro-
cedimiento de comparación sea válido. Aunque la probabilidad 𝛼 (fijado con
anterioridad), de rechazar una hipótesis nula verdadera para la prueba co-
mo un todo es pequeña, la probabilidad de rechazar al menos una hipótesis
verdadera cuando se prueban varios pares de medias es mayor de 𝛼.
1

2 CAPÍTULO 1. PRUEBAS DE COMPARACIONES MÚLTIPLES...
1.1.1. Conceptos preliminares
Sea un experimento con 𝑡 tratamientos y medias poblacionales 𝜇1, 𝜇2, . . . , 𝜇𝑡;
sea una combinación lineal de las medias 𝐿 =
𝑡∑
𝑖=1
𝑎𝑖𝜇𝑖, tal que
𝑡∑
𝑖=1
𝑎𝑖 = 0, es
decir un contraste.
Sean ¯𝑦1▪, ¯𝑦2▪, . . . , ¯𝑦𝑡▪ las medias muestrales obtenidas a partir de estas 𝑡 mues-
tras independientes de tamaños 𝑛1, 𝑛2, . . . , 𝑛𝑡, respectivamente. Sobre los
supuestos de distribución normal de los residuos y varianzas iguales, se tiene
que:
i) ˆ𝐿 =
𝑡∑
𝑖=1
𝑎𝑖 ¯𝑦𝑖▪ encontrándose además que 𝐸(ˆ𝐿) = 𝐿.
ii) 𝑉 (ˆ𝐿) = 𝜎2
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
y ˆ𝑉 (ˆ𝐿) = 𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
.
iii) ˆ𝐿 ∼ 𝑁(𝐿, 𝑉 (ˆ𝐿)).
iv) Dos contrastes
𝐿1 =
𝑡∑
𝑖=1
𝑎𝑖1𝜇𝑖 y 𝐿2 =
𝑡∑
𝑖=1
𝑎𝑖2𝜇𝑖,
cuyos estimadores son ˆ𝐿1 =
𝑡∑
𝑖=1
𝑎𝑖1 ¯𝑦𝑖▪ y ˆ𝐿2 =
𝑡∑
𝑖=1
𝑎𝑖2 ¯𝑦𝑖▪ respectivamente,
se dicen que son ortogonales si la covarianza entre ellos es nula, es decir
si se satisface
𝑡∑
𝑖=1
𝑎𝑖1𝑎𝑖2/𝑛𝑖 = 0.
1.1.2. Procedimientos de comparaciones múltiples
Si el interés es comparar todas las parejas de las 𝑡 medias de los tratamientos,
es decir, se desea probar 𝐻0 : 𝜇𝑖 = 𝜇𝑖′ para toda 𝑖 ∕= 𝑖′, 𝑖, 𝑖′ = 1, . . . , 𝑡;
existen en la literatura estad´ıstica muchos métodos que permiten hacer estas
comparaciones, se destacan a continuación algunos de éstos.
1. Prueba t de Student

1.1. PRUEBAS DE COMPARACIONES MÚLTIPLES 3
Suponga que se tiene interés en el contraste 𝐿 =
𝑡∑
𝑖=1
𝑎𝑖𝜇𝑖 teniendo en
cuenta los grados de libertad del residuo (𝑔𝑙𝑒) y que 𝐶𝑀𝐸
𝜎2 ∼ 𝜒2
(𝑔𝑙𝑒) y,
por la independencia de este con las ¯𝑦𝑖▪(𝑖 = 1, . . . , 𝑡) entonces,
ˆ𝐿 − 𝐿
√
𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
∼ 𝑡(𝑔𝑙𝑒)
De donde para un contraste particular:
𝑃𝑟
⎡
⎣ˆ𝐿 − 𝑡(𝑔𝑙𝑒,𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
≤ 𝐿 ≤ ˆ𝐿 + 𝑡(𝑔𝑙𝑒;𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
⎤
⎦ = 1 − 𝛼
Si se tiene en cuenta en la hipótesis: 𝐻0 : 𝐿 = 0 se rechaza con un
nivel de significancia de 𝛼 si
∣ˆ𝐿∣ > 𝑡(𝑔𝑙𝑒;𝛼/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
en caso contrario se tendrá evidencia estad´ıstica para no rechazar la
hipótesis de interés.
2. Método de Scheffé
Scheffe (1953), demuestra que para la totalidad de los contrastes 𝐿;
𝑃𝑟
[
ˆ𝐿 − 𝐹0𝑆0 ≤ 𝐿 ≤ ˆ𝐿 + 𝐹0𝑆0
]
= 1 − 𝛼
donde
𝐹0 =
√
(𝑡 − 1)𝐹(𝑡−1;𝑔𝑙𝑒;𝛼) 𝑦 𝑆0 =
√
ˆ𝑉 (ˆ𝐿) = ⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖

si se plantea la hipótesis 𝐻0 : 𝐿 = 0, se rechaza a un nivel significancia
𝛼 si
∣ˆ𝐿∣ ≥ 𝐹0𝑆0
Por otro lado, si 𝐿1 y 𝐿2 son contrastes ortogonales se observa en ?
que sobre ciertas condiciones
(ˆ𝐿1 − ˆ𝐿2)𝑡
(𝑉 (ˆ𝐿1−ˆ𝐿2)
𝜎2
𝑒
)
(ˆ𝐿1 − ˆ𝐿2)
(𝑡 − 1)𝐶𝑀𝐸
∼ 𝐹(𝑡−1;𝑔𝑙𝑒).
Donde ˆ𝐿1 y ˆ𝐿2 son contrastes los cuales estiman a 𝐿1 y 𝐿2, respec-
tivamente, en el espacio de las 𝑡-medias, 𝑉 (ˆ𝐿1 − ˆ𝐿2) es la matriz de
varianzas y covarianzas de ˆ𝐿1 − ˆ𝐿2.
Consecuentemente la región de confianza de tamaño (1 − 𝛼), es un
elipsoide donde el diámetro máximo es tal que
𝑃𝑟
[
∣𝐿1 − 𝐿2∣ ≤
√
(𝑡 − 1)𝐹(𝑡−1;𝑔𝑙𝑒;𝛼)𝐶𝑀𝐸
]
= 1 − 𝛼.
Se observa que el método está basado en el diámetro máximo que re-
presenta la dirección de un contraste particular de varianza máxima.
3. Método de Bonferroni (Fisher)
Este método fue usado por primera vez por Fisher (1935) y originó la
desigualdad de Bonferroni que tiene la siguiente base: “Para un con-
junto de 𝑚 contrastes, si cada uno es probado con un coeficiente de
confianza de 1−𝛼, el coeficiente de confianza conjunto es por lo menos
1 − 𝑚𝛼”.
El método de Bonferroni para comparaciones múltiples es adecuado
para probar 𝑚 contrastes y consiste en aplicar la prueba 𝑡-student a
cada uno de los contrastes usando un nivel de significancia 𝛼/𝑚, con
eso queda garantizado que el coeficiente de confianza conjunta es 1−𝛼.

Si dos intervalos de confianza de una misma muestra para los con-
trastes 𝐿1 y 𝐿2 se obtienen; sean los eventos 𝐴1 : El evento correspon-
diente al complemento del intervalo de confianza para 𝐿1 y 𝐴2 : En
forma análoga pero para 𝐿2 con 𝑃𝑟(𝐴1) = 𝑃𝑟(𝐴2) = 𝛼.
Se sabe que: 𝑃𝑟(𝐴1 ∪ 𝐴2) = 𝑃𝑟(𝐴1) + 𝑃𝑟(𝐴2) − 𝑃𝑟(𝐴1 ∩ 𝐴2) entonces
𝑃𝑟[(𝐴1 ∪ 𝐴2)𝑐] = 1 − 𝑃𝑟(𝐴1 ∪ 𝐴2). Además, por la desigualdad de
Boole: 𝑃𝑟(𝐴1 ∪ 𝐴2) ≤ 𝑃𝑟(𝐴1) + 𝑃𝑟(𝐴2), entonces 𝑃𝑟(𝐴𝑐
1 ∩ 𝐴𝑐
2) ≥
1 − 𝑃𝑟(𝐴1) − 𝑃𝑟(𝐴2) = 1 − 2𝛼, el cual corresponde, en este caso, al
evento región de confianza conjunta para 𝐿1 y 𝐿2.
En el caso general de la cobertura de 𝑚 eventos se satisface que
𝑃𝑟
⎛
⎝
𝑚∩
𝑗=1
𝐴𝑐
𝑗
⎞
⎠ ≥ 1 − 𝑚𝛼.
Observación 1.1. Cuando mayor sea el número de contrastes 𝑚;
menor es el nivel de significancia para cada contraste particular; luego
esta prueba se debe usar cuando 𝑚 no es muy grande.
La hipótesis 𝐻0 : 𝐿 = 0, se rechaza a un nivel de significancia 𝛼 si
∣ˆ𝐿∣ > 𝑡(𝑔𝑙𝑒;𝜀/2)
⎷𝐶𝑀𝐸
𝑡∑
𝑖=1
𝑎2
𝑖
𝑛𝑖
con 𝜀 = 2𝛼
𝑝(𝑝−1) cuando se comparan 𝑝 medias de tratamientos.
4. Método basado en la amplitud máxima
La distribución de las diferencias entre el mayor y el menor estad´ısti-
cos de orden del conjunto de las medias muestrales constituye la base
de este método .
Al considerar que ¯𝑦𝑖▪ es una variable aleatoria correspondiente a la
media muestral, la cual se distribuye en forma normal, la distancia

𝑄 =
𝑀𝑎𝑥(¯𝑦𝑖▪) − 𝑀𝑖𝑛(¯𝑦𝑖▪)
√
𝐶𝑀𝐸/𝑟
= 𝑀𝑎𝑥1≤𝑖≤𝑖′≤𝑡
(
∣¯𝑦𝑖▪ − ¯𝑦𝑖′▪∣
√
𝐶𝑀𝐸/𝑟
)
se le denomina la amplitud máxima estandarizada o estudentizada
(rango estudentizado) con parámetros 𝑡 y 𝑔𝑙𝑒.
La distribución de esta estad´ıstica se encuentra tabulada para varios
valores de 𝛼, es decir, existen tablas para valores 𝑞(𝑡;𝑔𝑙𝑒;𝛼) (ver tabla
correspondiente), tales que
𝑃𝑟
[
𝑄 ≤ 𝑞(𝑡;𝑔𝑙𝑒;𝛼)
]
= 1 − 𝛼.
Por lo tanto, se rechaza la hipótesis 𝐻0 : 𝐿 = 0, si 𝑄 > 𝑞(𝑡;𝑔𝑙𝑒;𝛼).
Observación 1.2. La prueba 𝑡-student y de Bonferroni para contraste
de dos medias pueden ser vistas como un caso particular de aplicación
de la amplitud estudentizada.
5. Método de Tukey
Tukey(1953) propuso un método de comparación múltiple que tam-
bién está basado en los intervalos o regiones de confianza. Este es
usado para comparar la totalidad de las
(𝑡
2
)
contrastes de medias de
tipo 𝐿 = 𝜇𝑖 − 𝜇𝑖′ , 1 ≤ 𝑖 ≤ 𝑖′ ≤ 𝑡.
Si se considera que 𝑛1 = ⋅ ⋅ ⋅ = 𝑛𝑡 = 𝑟 se demuestra que 1 − 𝛼 es
la probabilidad de que las 𝑡(𝑡 − 1)/2 comparaciones de dos medias
satisfagan simultáneamente la condición
(¯𝑦𝑖▪ − ¯𝑦𝑖′▪) ±
√
𝐶𝑀𝐸
𝑟
𝑞(𝑡;𝑔𝑙𝑒;𝛼)
siendo 𝑞(𝑡;𝑔𝑙𝑒;𝛼) el valor correspondiente en la tabla apropiada.
Luego con un nivel de significancia 𝛼 el estad´ıstico de prueba para
la hipótesis 𝐻0 : 𝜇𝑖 = 𝜇𝑖′ contra 𝐻𝑎 : 𝜇𝑖 ∕= 𝜇𝑖′ , esta dado por
Δ =
√
𝐶𝑀𝐸
𝑟 𝑞(𝑡;𝑔𝑙𝑒;𝛼).
Si ∣ˆ𝐿∣ = ∣ˆ𝜇𝑖 − ˆ𝜇𝑖′ ∣ > Δ se rechaza 𝐻0.

Observación 1.3. La prueba de Tukey exige en principio balancea-
miento.
6. Método de Newman-Keuls (N-K)
Esta prueba fue diseñada por Newman(1939) y modificada por Keuls
(1952), quien generó un nuevo interés en la prueba de Newman y por
ello el procedimiento se conoce como la prueba de Newman-Keuls.
Esta prueba es un procedimiento secuencial basado en la amplitud es-
tandariza y es válido para la totalidad de contrastes de dos medias
como en los métodos anteriores.
Se exige la condición de balanceamiento es decir 𝑛1 = ⋅ ⋅ ⋅ = 𝑛𝑡 = 𝑟, y
el estad´ıstico 𝑄 se estudia con parámetros 𝑝 y 𝑔𝑙𝑒, con 𝑝 el número de
medias ordenadas cubiertas por el contraste en estudio.
En la aplicación de la prueba se siguen los siguientes pasos:
a) Ordenar las medias en un orden creciente o decreciente.
b) Se compara la mayor media (𝑝′ = 𝑝) con la menor. Para esa
comparación se determina
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛼) y la estimación del
contraste; si el valor
𝑁𝐾𝑝 =
√
𝐶𝑀𝐸
𝑟
𝑞(𝑝′;𝑔𝑙𝑒;𝛼) > ∣ˆ𝐿∣
las medias son cubiertas por una subl´ınea que permite determinar
o afirmar que no hay diferencias significativas entre ellas. En el
caso contrario se hace el siguiente paso.
c) Se reduce una unidad el valor de 𝑝′ calculándose de nuevo el va-
lor de 𝐶𝑀𝐸, es decir
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛼) y para todos los pares de
medias que no estén cubiertos por una misma l´ınea y que cubren
𝑝′ medias, se repite el proceso de comparación.
d) Se repite c) hasta que 𝑝′ = 1.

Observación 1.4. Esta prueba tiene como inconveniente el hecho que
como las medias ordenadas no son independientes, el valor de 𝑞(𝑝′;𝑔𝑙𝑒;𝛼)
no es exacto.
Nota:
i) La prueba de N-K es un procedimiento secuencial válido para la
totalidad de los contrastes de dos medias.
ii) N-K exige en principio balanceamiento.
iii) N-K es una prueba aproximada.
7. Método de Duncan
Constituye también un procedimiento secuencial válido para la com-
paración del contraste de dos medias. La prueba está basada en la am-
plitud estudentizada, 𝑞(𝑝′;𝑔𝑙𝑒;𝛼). En este caso, tanto 𝑝′ como 𝛼 var´ıan
durante la aplicación de la prueba; 𝑝′ es el número de medias ordenadas
cubiertas por el contraste en estudio y 𝛼 es el nivel de significancia con-
siderado en cada paso de aplicación de la prueba.
Para un contraste sobre 𝑝 medias ordenadas el valor de 𝛼 es igual a
1 − (1 − 𝛼)𝑝−1.
Los pasos para la aplicación de la prueba estad´ıstica son los mismos
que los de N-K, solo que los valores del contraste son comparados con
𝐷 =
√
𝐶𝑀𝐸
𝑟
𝑞(𝑝′;𝑔𝑙𝑒;𝛾𝑝)
𝛾𝑝 = 1 − (1 − 𝛼)𝑝−1 es el nivel de significancia, tomado como si se
incluyeran 𝑝 − 1 contrastes ortogonales en cada paso y cada valor de
𝐷 es calculado como si las medias fueran independientes, pero como
están ordenadas no van a ser independientes.
La regla de decisión es rechazar 𝐻0 si ∣¯𝑦𝑖▪ − ¯𝑦𝑖′▪∣ ≥
√
𝐶𝑀𝐸
𝑟 𝑞(𝑝′;𝑔𝑙𝑒;𝛾𝑝).

Teniendo como casos particulares
Prueba t 𝑝′ = 2 𝛼′ = 𝛼
Prueba de Bonfer-
roni
𝑝′ = 2 𝛼′ = 𝛼/𝑚
Prueba de Tukey 𝑝′ = 𝑝 𝛼′ = 𝛼
Prueba N-K 𝑝′ = 𝑝, 𝑝 − 1, . . . , 2 𝛼′ = 𝛼
Prueba de Duncan 𝑝′ = 𝑝, 𝑝 − 1, . . . , 2 𝛼′ = 1 − (1 − 𝛼)𝑝′
8. Método de Dunnett
Dunnet(1955), desarrolla un procedimiento para comparar un trata-
miento control (testigo) con otros tratamientos.
Sea 𝜇𝑇 y 𝜇𝑖 (𝑖 = 1, 2, . . . , 𝑡) las medias poblacionales del control y
de los demás 𝑝 = 𝑡 − 1 tratamientos y, 𝑛𝑇 y 𝑛𝑖 las correspondientes
replicaciones.
Para la totalidad de los contrastes 𝐿 = 𝜇𝑖 − 𝜇𝑇 , se tiene que
𝑃𝑟
[
∣𝐿 − ˆ𝐿∣ < 𝑑(𝑝;𝑔𝑙𝑒;𝛼)
√(
1
𝑛𝑖
+
1
𝑛𝑇
)
𝐶𝑀𝐸
]
= 1 − 𝛼
Con un nivel 𝛼 de significancia se rechaza 𝐻0 si
∣¯𝑦𝑖▪ − ¯𝑦𝑇▪∣ ≥ 𝑑(𝑝;𝑔𝑙𝑒;𝛼)
√(
1
𝑛𝑖
+
1
𝑛𝑇
)
𝐶𝑀𝐸
Observación 1.5. Es conveniente usar más observaciones en el trata-
miento control que en los otros tratamientos.
En la tabla de Dunnett se presenta los valores cr´ıticos para la prueba
de Dunnett asociados a algunos valores de 𝛼 (𝑑(𝑝;𝑔𝑙𝑒;𝛼)).
1.1.2.1. Algunos comentarios sobre comparaciones múltiples
Las pruebas de Tukey y de Duncan tienen bases muy semejantes, sin em-
bargo, la prueba de Duncan da diferencias significativas con más facilidad,
ya que al formular un nivel de significancia del 5 % la probabilidad de que
un contraste incluya dos medias exige una probabilidad del 95 % de que no

se encuentre significancia en una diferencia realmente nula, para el caso de
tres medias la probabilidad será de (0, 95)2, en el caso de 𝑡 medias la proba-
bilidad será de (0,95)𝑡−1; en tanto que la prueba de Tukey es más exigente,
mantiene siempre una probabilidad de (0, 95) de no encontrar significancia
en una diferencia realmente nula entre todas las medias de los tratamientos.
La prueba de Duncan aplicada ampliamente no es muy rigurosa, por lo cual
debe ser usada con mucha cautela. As´ı la prueba de Duncan es un interme-
dio entre el excesivo rigor de la prueba de Tukey y la falta de rigor de la
prueba 𝑡-student.
La prueba de Scheffé es aún más rigurosa, no es recomendable para la com-
paración de dos medias, pero puede usarse en contrastes más amplios (de
más de dos medias), ésta es más poderosa que el método de Bonferroni si
el número de comparaciones es relativamente más grande que el número de
media

Pruebas comparaciones multiples1unidad_ii_ia

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (15)

Destacado

Destacado (20)

Similar a Pruebas comparaciones multiples1unidad_ii_ia

Similar a Pruebas comparaciones multiples1unidad_ii_ia (20)

Último

Último (20)

Pruebas comparaciones multiples1unidad_ii_ia