O documento descreve o teste para inferência de simetrias de distribuições, um método estatístico para determinar se um conjunto de dados foi gerado por uma distribuição simétrica desconhecida. O procedimento envolve classificar triplas de dados como direita, esquerda ou nenhuma, e calcular estatísticas T e z para testar a hipótese nula de simetria. Um exemplo aplica o método a dados reais e conclui que a distribuição é simétrica com base nos resultados estatísticos.
Teste para Inferência de Simetria de Distribuições
1. UNIVERSIDADE FEDERAL DE ALFENAS Introdução à Estatística Não-Paramétrica
Teste Para Inferência de Simetrias de Distribuições
Discente: João A. Silva
Docente: Eric Batista Ferreira
Disciplina: Introdução à Estatística Não-Paramétrica
25 de setembro de 2012
João (Unifal-MG) 25 de setembro de 2012 1 / 19
2. Introdução
O Teste Para Inferência de Simetrias de Distribuições é um teste para
simetria distribucional e permite inferir se um conjunto de dados foi
gerado por uma distribuição desconhecida, porém simétrica.
Consiste no exame de subconjuntos de três variáveis e uma boa
quantidade de cálculos, mas é relativamente direto.
João (Unifal-MG) 25 de setembro de 2012 2 / 19
3. Introdução
H0
: As observações são de uma mesma distribuição simétrica
com uma mediana desconhecida.
H
: A distribuição não é simétrica.
1
João (Unifal-MG) 25 de setembro de 2012 3 / 19
4. Procedimento
Para cada subconjunto de tamanho 3 na sequência de
observações, determine se ela é uma tripla direita, esquerda, ou
nenhuma.
Tripla direita: (xi + xj + xk )/3 > med(xi , xj , xk )
Tripla esquerda: (xi + xj + xk )/3 < med(xi , xj , xk )
Nenhuma: (xi + xj + xk )/3 = med(xi , xj , xk )
Cada uma das n(n − 1)(n − 2)/6 triplas possíveis devem ser
codificada como direita, esquerda ou nenhuma.
João (Unifal-MG) 25 de setembro de 2012 4 / 19
5. Procedimento
Calcule as quantidades Bi e Bjk para cada variável xi e o par de
variáveis xj e xk :
Bi = triplas direitas envolvendo xi - triplas esquerdas
envolvendo xi
Bjk = triplas direitas envolvendo xj e xk - triplas
esquerdas envolvendo xj e xk
João (Unifal-MG) 25 de setembro de 2012 5 / 19
6. Procedimento
Calcule T e sua variância:
T = triplas direitas - triplas esquerdas
n
2 (n−3)(n−4) (n−3) n(n−1)(n−2)
σT = (n−1)(n−2) Bi2 + (n−4)
2
Bjk + 6 −
i=1 1≤j<k ≤n
(n−3)(n−4)(n−5)
1− n(n−1)(n−2) T2
João (Unifal-MG) 25 de setembro de 2012 6 / 19
7. Procedimento
T
Teste H0 usando a estatística z = σT .
A significância de T pode ser encontrada usando a tabela da
distribuição normal padrão. Como a hipótese alternativa é
bilateral, o valor crítico de T é determinado usando α .
2
João (Unifal-MG) 25 de setembro de 2012 7 / 19
8. Exemplo
Em um acordo de supressão de sensação de salgado, sujeitos testam
uma mistura de sal e sacarose com o propósito de escalonar
julgamentos de sensação de salgado como uma função da
concentração de sal na solução. Havia diferenças individuais
substanciais no julgamento de sensação de salgado. O pesquisador
estava interessado na distribuição dos julgamentos de sensação de
salgado. Quatro concentrações diferentes foram usadas e os sujeitos
experimentaram, separadamente, cada uma delas. Os dados estão
resumidos na Tabela 1. Para fins de ilustrar o teste de distribuição
simétrica, os dados para a taxa de 0,5 de concentração de sal serão
analisados.
João (Unifal-MG) 25 de setembro de 2012 8 / 19
9. Exemplo
Tabela 1: Julgamentos sobre a sensação de salgado
para um nível de concentração de sal
13,53
28,42
48,11
48,64
51,40
59,91
67,98
79,13
103,05
João (Unifal-MG) 25 de setembro de 2012 9 / 19
10. Exemplo - Hipóteses
H0 : A distribuição dos julgamentos de sensação de salgado é simétrica.
H1 : A distribuição dos julgamentos é assimétrica.
João (Unifal-MG) 25 de setembro de 2012 10 / 19
11. Exemplo - Teste Estatístico
O número de observações é n=9.
O primeiro passo consiste no cálculo das triplas e a determinação
sobre elas serem direitas, esquerdas ou nenhuma das duas.
Note que para n = 9 temos:
n(n−1)(n−2) 9(9−1)(9−2)
6 = 6 = 84 triplas.
João (Unifal-MG) 25 de setembro de 2012 11 / 19
12. Exemplo - Teste Estatístico
Classificação dos três primeiros pontos (13,53; 28,42; 48,11)
mediana = 28,42 < 30,03 = média −→ tripla direita.
Classificação dos pontos (13,53; 48,11; 48,64)
mediana = 48,11 > 36,76 = média −→ tripla esquerea.
João (Unifal-MG) 25 de setembro de 2012 12 / 19
13. Exemplo - Teste Estatístico
Após a verificação das 84 triplas, temos o número de triplas
direitas = 44 e o número de triplas esquerdas = 40.
Então
T = 44 − 40 = 4
João (Unifal-MG) 25 de setembro de 2012 13 / 19
14. Exemplo - Teste Estatístico
O próximo passo é o cálculo da variância de T .
Para isso, deve-se calcular os valores intermediário de Bi e Bjk .
As duas somas dos quadrados no exemplo são:
n n
Bi2 = 320 e 2
Bjk = 364
i=1 i≤j<k ≤n
João (Unifal-MG) 25 de setembro de 2012 14 / 19
15. Exemplo - Teste Estatístico
A variância é então:
n
2 (n−3)(n−4) (n−3) n(n−1)(n−2)
σT = (n−1)(n−2) Bi2 + (n−4)
2
Bjk + 6 −
i=1 1≤j<k ≤n
(n−3)(n−4)(n−5)
1− n(n−1)(n−2) T2
(9−3)(9−4) (9−3) 9(9−1)(9−2)
= (9−1)(9−2) ∗ 320 + (9−4) ∗ 364 + 6 −
1 − (n−3)(n−4)(n−5)
n(n−1)(n−2) ∗ 42 = 680, 04
João (Unifal-MG) 25 de setembro de 2012 15 / 19
16. Exemplo - Teste Estatístico
Finalmente, a estatística
T 4
z= σT =√ = 0, 154
680,04
João (Unifal-MG) 25 de setembro de 2012 16 / 19
17. Exemplo - Nível de significância e decisão
Seja α = 0,05.
Zc = 0, 154
e
Z(0,025) ≈ 2, 81
Logo, não podemos rejeitar a hipóstese de simetria, ou seja, a
distribuição dos julgamentos da sensação de salgado é simétrica.
João (Unifal-MG) 25 de setembro de 2012 17 / 19
18. Considerações finais
O teste para inferência de simetrias de distribuições é
razoavelmente bom para n ≥ 20, isto é, ele mantém o nível de
significância escolhido e ao mesmo tempo mantém bom poder
para detectar distribuições assimétricas.
Devido ao grande número de cálculos envolvidos na
determinação das triplas, recomenda-se o uso de um programa
computacional.
O poder do teste de simetria tem sido estudado e apresentado
um poder razoável para amostras maiores do que 20. Outros
testes tem sido propostos, mas a maioria tem poder muito baixo.
João (Unifal-MG) 25 de setembro de 2012 18 / 19
19. Bibliografia
SIEGEL, S.; CASTELLAN, JR., N.J Estatística não-paramétrica
para ciências do comportamento. Artmed, Porto Alegre, 2006.
pages 75 - 78
João (Unifal-MG) 25 de setembro de 2012 19 / 19