1. Análise de Variância
Comparação de várias médias
A Análise de Variância é um método
suficientemente poderoso para identificar
diferenças entre as médias populacionais
devidas a várias causas atuando
simultaneamente sobre os elementos da
população.
Uma Classificação – Amostras de
mesmo tamanho
K amostras de tamanho n retiradas de k
populações cujas médias (i=1,2,...,k)
queremos comparar (testar a hipótese):
H" : # = $ =⋯=
Contra a alternativa de que pelo menos
uma das médias populacionais seja
diferente.
2. Se considerarmos as médias sob a
forma + , ˩ = 1,2, … ˫, poderemos
formular alternativamente,
H" : # = $ =⋯= =0
Hipóteses básicas :
Homocedasticidade: ˫ populações tenham
a mesma variância e que a variável de
interesse seja normalmente distribuída em
todas as populações.
Notações:
˲ (˩ = 1,2, … , ˫; ˪ = 1,2, … , J) é o ˪-ésimo
valor da ˩-ésima amostra de J elementos;
ˠ = (# ˲ = soma dos valores da ˩-
ésima amostra;
˝ = (# ˲ $ = soma dos quadrados;
3. ˠ= (# ˠ = (# (# ˲ = soma total;
˝ = (# ˝ = (# (# ˲ $ = soma total dos
quadrados;
˲ = ˠ /J= média da ˩-ésima amostra;
˲ = ˠ/J˫=média de todos os valores.
$
Três formas de estimar a variância :
1-Estimativa total WY (Junta todas as
amostras numa grande amostra)
( )
WY =
& &
=
#
& & ( ) Ӛ & & / ӛ /
=
# #
O numerador ˝ − ˠ $ /J˫ denominaremos
de soma de quadrados total, ou SQT.
4. 2-Estimativa entre amostras Wͧ (Variância
amostral da média amostral estima )
( )
Wͧ = J
=
#
Ӡ (# ˲$−
ӡ=
#
$
@ (# Ә ә − D=
#
/ /
#
O numerador (# ˠ $ /J − ˠ $ /J˫
denominaremos de soma de quadrados
entre amostras, ou SQE.
5. 3-Estimativa residual WW
Cada amostra individual fornecerá uma
estimativa da variância $ :
– /
˟ =
$
= =
# #
/
#
Sendo as amostras de mesmo tamanho, a
estimativa resultante para o conjunto de
amostras será a média aritmética das k
estimativas individuais:
/ /
˟ =
$
= (# (
=
#) ( #)
O numerador ˝ − (# ˠ $ /J é soma dos
quadrados residual, ou SQR.
6. Exemplo para ilustrar a ANOVA
Amostra 1: 64 66 59 65 62
Amostra 2: 71 73 66 70 68
Amostra 3: 52 57 53 56 53
Exemplo
Três chapas de uma liga metálica de
mesma procedência foram submetidas a
três diferentes tratamentos térmicos, A, B e
C. Após o tratamento, foram tomadas cinco
medidas de dureza superficial de cada
chapa, obtendo-se:
Tratamento Dureza
A 68 74 77 70 71
B 67 65 69 66 67
C 73 77 76 69 80
7. Verificar, aos níveis de 1 e 5% de
significância, se existe diferença
significativa entre os tratamentos térmicos
aplicados.
Uma Classificação – Amostras de
Tamanhos Diferentes
Neste caso, o índice ˪ referente à
caracterização do elemento dentro de cada
amostra ˩ variará de 1 a J , sendo J o
tamanho da ˩-ésima amostra. →
ˠ = (# ˲ , ˝ = (# ˲$
ˠ= (# ˠ = (# (# ˲
˝= (# ˝ = (# (# ˲$
˲ = ˠ /J , ˲ = ˠ/ (# J .
→
/
WY =
=
# #
8. ( / ) /
Wͧ =
=
# #
( / )
WW =
=
Duas Classificações – (Sem Repetição)
No caso dos elementos serem classificados
segundo dois critérios (n amostras de k
elementos ou k amostras de n elementos)
Segundo critério
˲## ˲#$ ... ˲# ... ˲#
˲$# ˲$$ ... ˲$ ... ˲$
Primeiro !
Critério ˲ # ˲ $ ... ˲ ... ˲
!
˲ # ˲ $ ... ˲ ... ˲
9. podemos testar:
H# : # = $ =⋯=
H$ : # = $ =⋯=
A aceitação de H# significa a não-
comprovação de diferença significativa
entre as médias segundo o critério das
linhas, enquanto que a aceitação de H$
chega à mesma conclusão em relação ao
das colunas.
Admitindo as mesmas hipóteses implícitas:
$
= $ e Normalmente distribuída e
supondo a inexistência de interação entre
as duas classificações a aditividade dos
efeitos das linhas e das colunas é válida:
˲ = + + +
10. Sendo:
: a média geral teórica
: efeito da ˩-ésima linha
: efeito da ˪-ésima coluna
: variação aleatória
As notações passam a ser:
ˠ = (# ˲ = soma dos valores da ˩-
ésima linha;
˝ = (# ˲ $ = soma dos quadrados...;
ˠ = (# ˲ = soma dos valores da ˪-ésima
coluna;
˝ = (# ˲ $ = soma dos quadrados...;
ˠ= (# ˠ = (# ˠ = soma total;
˝ = (# ˝ = (# ˝ soma total dos
quadrados;
11. ˲ = ˠ /J= média da ˩-ésima linha;
˲ = ˠ /˫= média da ˪-ésima coluna;
˲ = ˠ/J˫=média de todos os valores.
A variância comum $ pode ser estimada
de 4 maneiras agora:
( ) / /
Wͮ = J
=
# #
/ /
WV = ˫ =
# #
/ / /
WW =
( #)( #)
As duas hipóteses são testadas
independentemente por respectivamente:
˘ = e˘ =
12. Exemplo
Numa experiência agrícola foram usados 6
diferentes fertilizantes em duas variedades
de milho, tendo sido obtidas as colheitas
dadas a seguir, em sacas:
Fert.: A B C D E F
Var.1: 5,4 3,2 3,8 4,6 5,0 4,4
Var.2: 5,7 4,0 4,2 4,5 5,3 5,0
Utilizar a ANOVA para verificar se existem
diferenças significativas entre os
fertilizantes e entre as variedades ao nível
de 1% de significância.
Duas Classificações – (Com Repetição)
Estender o teste anterior para J
observações sob cada tratamento
Com possibilidade de replicações podemos
obter uma estimativa de $ dentro dos nk
13. tratamentos. Representamos esta
estimativa por ˟ $ e a respectiva soma de
quadrados por ˟˝ˠJ
˟˝ˠJ = (# (# −
˟˝H = (#
..
−
˟˝˕ = (#
. .
−
Pode-se verificar que
˟˝ˠJ ˟˝H + ˟˝˕ e a soma dos
respectivos graus de liberdade (˫ − 1) +
(J − 1) J˫ − 1. Isto se deve a uma
parcela da interação entre linhas e colunas.
A tabela da ANOVA fica então:
14. Exemplo
Foram observados os tempos, em
segundos, gastos por 4 operários para
montar certa peça por três métodos
diferentes. Cada operário montou 2 peças
por cada método, com os tempos na tabela
a seguir. Verificar, pela ANOVA, se existe
diferença significativa entre os métodos
e/ou entre os operários, a nível de 5% de
significância.
Operários
1 2 3 4
I 54 46 55 51
52 47 54 60
Métodos II 59 61 59 56
57 55 61 57