11 análise de variância

Análise de Variância
Comparação de várias médias
A Análise de Variância é um método
suficientemente poderoso para identificar
diferenças entre as médias populacionais
devidas a várias causas atuando
simultaneamente sobre os elementos da
população.
Uma Classificação – Amostras de
mesmo tamanho
K amostras de tamanho n retiradas de k
populações cujas médias (i=1,2,...,k)
queremos comparar (testar a hipótese):
H" : # = $ =⋯=
Contra a alternativa de que pelo menos
uma das médias populacionais seja
diferente.

Se considerarmos as médias sob a
forma + , ˩ = 1,2, … ˫, poderemos
formular alternativamente,
H" : # = $ =⋯= =0

Hipóteses básicas :
Homocedasticidade: ˫ populações tenham
a mesma variância e que a variável de
interesse seja normalmente distribuída em
todas as populações.
Notações:
˲ (˩ = 1,2, … , ˫; ˪ = 1,2, … , J) é o ˪-ésimo
valor da ˩-ésima amostra de J elementos;
ˠ = (# ˲ = soma dos valores da ˩-
ésima amostra;
˝ = (# ˲ $ = soma dos quadrados;

ˠ= (# ˠ = (# (# ˲ = soma total;

˝ = (# ˝ = (# (# ˲ $ = soma total dos
quadrados;
˲ = ˠ /J= média da ˩-ésima amostra;
˲ = ˠ/J˫=média de todos os valores.

$
Três formas de estimar a variância :
1-Estimativa total WY (Junta todas as
amostras numa grande amostra)
( )
WY =
& &
=
#

& & ( ) Ӛ & & / ӛ /
=
# #

O numerador ˝ − ˠ $ /J˫ denominaremos
de soma de quadrados total, ou SQT.

2-Estimativa entre amostras Wͧ (Variância

amostral da média amostral estima )
( )
Wͧ = J
=
#

Ӡ (# ˲$−
ӡ=
#

$
@ (# Ә ә − D=
#

/ /
#

O numerador (# ˠ $ /J − ˠ $ /J˫
denominaremos de soma de quadrados
entre amostras, ou SQE.

3-Estimativa residual WW
Cada amostra individual fornecerá uma
estimativa da variância $ :
– /
˟ =
$
= =

# #
/
#

Sendo as amostras de mesmo tamanho, a
estimativa resultante para o conjunto de
amostras será a média aritmética das k
estimativas individuais:
/ /
˟ =
$
= (# (
=
#) ( #)

O numerador ˝ − (# ˠ $ /J é soma dos
quadrados residual, ou SQR.

Exemplo para ilustrar a ANOVA
Amostra 1: 64 66 59 65 62
Amostra 2: 71 73 66 70 68
Amostra 3: 52 57 53 56 53

Exemplo
Três chapas de uma liga metálica de
mesma procedência foram submetidas a
três diferentes tratamentos térmicos, A, B e
C. Após o tratamento, foram tomadas cinco
medidas de dureza superficial de cada
chapa, obtendo-se:
Tratamento Dureza
A 68 74 77 70 71
B 67 65 69 66 67
C 73 77 76 69 80

Verificar, aos níveis de 1 e 5% de
significância, se existe diferença
significativa entre os tratamentos térmicos
aplicados.
Uma Classificação – Amostras de
Tamanhos Diferentes
Neste caso, o índice ˪ referente à
caracterização do elemento dentro de cada
amostra ˩ variará de 1 a J , sendo J o
tamanho da ˩-ésima amostra. →
ˠ = (# ˲ , ˝ = (# ˲$

ˠ= (# ˠ = (# (# ˲

˝= (# ˝ = (# (# ˲$

˲ = ˠ /J , ˲ = ˠ/ (# J .
→
/
WY =
=
# #

( / ) /
Wͧ =
=
# #

( / )
WW =
=

Duas Classificações – (Sem Repetição)
No caso dos elementos serem classificados
segundo dois critérios (n amostras de k
elementos ou k amostras de n elementos)
Segundo critério
˲## ˲#$ ... ˲# ... ˲#
˲$# ˲$$ ... ˲$ ... ˲$
Primeiro !
Critério ˲ # ˲ $ ... ˲ ... ˲
!
˲ # ˲ $ ... ˲ ... ˲

podemos testar:
H# : # = $ =⋯=
H$ : # = $ =⋯=

A aceitação de H# significa a não-
comprovação de diferença significativa
entre as médias segundo o critério das
linhas, enquanto que a aceitação de H$
chega à mesma conclusão em relação ao
das colunas.

Admitindo as mesmas hipóteses implícitas:
$
= $ e Normalmente distribuída e
supondo a inexistência de interação entre
as duas classificações a aditividade dos
efeitos das linhas e das colunas é válida:
˲ = + + +

Sendo:
: a média geral teórica
: efeito da ˩-ésima linha
: efeito da ˪-ésima coluna
: variação aleatória
As notações passam a ser:
ˠ = (# ˲ = soma dos valores da ˩-
ésima linha;
˝ = (# ˲ $ = soma dos quadrados...;

ˠ = (# ˲ = soma dos valores da ˪-ésima
coluna;
˝ = (# ˲ $ = soma dos quadrados...;

ˠ= (# ˠ = (# ˠ = soma total;

˝ = (# ˝ = (# ˝ soma total dos
quadrados;

˲ = ˠ /J= média da ˩-ésima linha;
˲ = ˠ /˫= média da ˪-ésima coluna;
˲ = ˠ/J˫=média de todos os valores.
A variância comum $ pode ser estimada
de 4 maneiras agora:
( ) / /
Wͮ = J
=
# #

/ /
WV = ˫ =

# #

/ / /
WW =

( #)( #)

As duas hipóteses são testadas
independentemente por respectivamente:

˘ = e˘ =

Exemplo
Numa experiência agrícola foram usados 6
diferentes fertilizantes em duas variedades
de milho, tendo sido obtidas as colheitas
dadas a seguir, em sacas:
Fert.: A B C D E F
Var.1: 5,4 3,2 3,8 4,6 5,0 4,4
Var.2: 5,7 4,0 4,2 4,5 5,3 5,0
Utilizar a ANOVA para verificar se existem
diferenças significativas entre os
fertilizantes e entre as variedades ao nível
de 1% de significância.
Duas Classificações – (Com Repetição)
Estender o teste anterior para J
observações sob cada tratamento
Com possibilidade de replicações podemos
obter uma estimativa de $ dentro dos nk

tratamentos. Representamos esta
estimativa por ˟ $ e a respectiva soma de
quadrados por ˟˝ˠJ

˟˝ˠJ = (# (# −

˟˝H = (#
..
−

˟˝˕ = (#
. .
−

Pode-se verificar que
˟˝ˠJ ˟˝H + ˟˝˕ e a soma dos
respectivos graus de liberdade (˫ − 1) +
(J − 1) J˫ − 1. Isto se deve a uma
parcela da interação entre linhas e colunas.
A tabela da ANOVA fica então:

Exemplo
Foram observados os tempos, em
segundos, gastos por 4 operários para
montar certa peça por três métodos
diferentes. Cada operário montou 2 peças
por cada método, com os tempos na tabela
a seguir. Verificar, pela ANOVA, se existe
diferença significativa entre os métodos
e/ou entre os operários, a nível de 5% de
significância.
Operários
1 2 3 4
I 54 46 55 51
52 47 54 60

Métodos II 59 61 59 56
57 55 61 57

III 59 63 63 59
62 58 61 60

11 análise de variância

Recomendados

Recomendados

Más contenido relacionado

Similar a 11 análise de variância

Similar a 11 análise de variância (20)

Más de Fernando Lucas

Más de Fernando Lucas (20)

11 análise de variância