A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)
1. Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
Profa. Dra. Livia M. A. Tenuta
litenuta@fop.unicamp.br
Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -
1
2. “A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983
Para muitos, estatística é...
2
3. Figueira CV, 2006
Para outros...
“Estatística é a arte de torturar
os dados até que eles digam o
que se quer ouvir”
Mills, 1993,
Susin & Rösing, 1999
3
5. Testes estatísticos mais comuns
Número e tipo de grupos
Independentes
(não pareados)
2 grupos
Dependentes
(pareados)
Independentes
(não pareados)
3 ou mais grupos
Dependentes
(pareados)
Paramétrico
Não paramétrico
Teste t para
amostras
independentes
Teste de MannWhitney
Teste t para
amostras
dependentes
Teste de Wilcoxon
ANOVA
Teste de KruskalWallis
ANOVA medidas
repetidas
Teste de Friedman
Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
Métodos de regressão mais comuns
Tipo de observações
Dados contínuos
Dados categóricos
Independentes
Regressão linear
Regressão logística
dicotômica, multinomial e
ordenada
Dependentes
Regressão linear com erro
padrão ajustado para o
agrupamento das
observações
Regressão logística
condicional e extensões
Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
5
6. Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose
• Controle negativo: sem dentifrício
• Controle ativo: 1.5% Lactose
• Controle ativo: MFP/SiO2
• Experimental: Zero
CalR
• Experimental: MFP/CaCO3
Pesquisa científica
Pergunta (???) – curiosidade científica!
Delineamento experimental adequado
para testar a pergunta
Variáveis resposta que ajudem a
explicar o fenômeno
6
7. Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A:
Tratamento B:
21,5%
18,9%
23,6%
24,4%
39,7%
26,7%
29,5%
19,4%
32,7%
17,8%
Média
29,4%
Média
21,4%
Diferença estimada entre A e B: 8%
Estatística experimental
Existe uma real diferença entre os
tratamentos A e B?
Para descobrir, o experimento deveria
ser repetido infinitas vezes!
7
8. Estatística experimental
Inferência estatística: determina a
probabilidade de estimar se uma real
diferença entre tratamentos existe
Nível de significância (p): probabilidade
de erro ao afirmar que há diferença entre
os tratamentos
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A:
Tratamento B:
21,5%
18,9%
23,6%
24,4%
39,7%
26,7%
29,5%
19,4%
32,7%
17,8%
Média
DP
29,4%
7,3%
Média
DP
21,4%
3,9%
8
9. Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média
ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento
9
10. Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)
Dentifrício A
5,5
Dentifrício B
11,4
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média ± DP, n=56)
Dentifrício A
5,5 ± 4,5
Dentifrício B
11,4 ± 21,0
10
11. Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios
11
14. Delineamento inteiramente aleatorizado
Esquema da análise de variância:
Fonte de
variação
Tratamento
Resíduo
Total
Graus de
liberdade
Soma de Quadrados
Quadrado médio
F
I–1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
I (J – 1)
Por diferença
SQ resíduo
GL resíduo
-
IJ – 1
Variabilidade total
-
-
I = número de níveis do tratamento
J = número de repetições
Delineamento inteiramente aleatorizado
Modelo matemático:
Yij = µ + ti + eij
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
eij = erro aleatório
14
15. Controle
70 ppm F
140 ppm F
280 ppm F
Estatística experimental
Teste de hipóteses: regra de decisão para
rejeitar ou não uma hipótese estatística
com base nos elementos amostrais
H0 (hipótese nula): hipótese que será testada
estatisticamente
Ha (hipótese alternativa): suposição que o
pesquisador quer estudar
15
16. Delineamento inteiramente aleatorizado
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Estatística experimental
Ao rejeitar H0, com nível de significância
de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa
16
17. “In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”
Fisher RA
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A:
Tratamento B:
21,5%
18,9%
23,6%
24,4%
39,7%
26,7%
nível de
29,5%
19,4%
significância
32,7%
17,8%
de 5%
Média
29,4%
Média
Diferem ao
21,4%
Erro tipo I (α): probabilidade de erro ao se rejeitar a
hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo
17
18. Trabalhando com probabilidades...
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
Correlação entre variáveis: se eu tiver 10 variáveis
e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)
Em 5% delas, posso ver uma correlação
significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
É função do:
a) número de repetições
b) variabilidade dos dados
c) real diferença entre os grupos
18
19. Repetição
Proporciona uma estimativa do erro
experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.
Repetição
n=3
Tratamento A:
Tratamento B:
20
17
24
22
25
24
Média
23
Média
21
Teste t comparando A e B: p=0,48
19
20. Repetição
n=30
Tratamento A:
Tratamento B:
20, 24, 25, 21, 23,
25, 20, 23, 26, 20,
24, 25, 20, 24, 25,
22, 24, 23, 21, 23,
26, 19, 24, 25, 20,
24, 25, 19, 25, 25
15, 22, 26, 16, 23,
24, 15, 24, 24, 17,
22, 24, 17, 22, 24,
17, 16, 22, 24, 23,
24, 17, 22, 24, 17,
22, 24, 14, 24, 25
Média
23
Média
21
Teste t comparando A e B: p=0,0137
Repetição
n=3
Tratamento A:
Tratamento B:
20
10
24
13
25
16
Média
23
Média
13
Diferença entre A e B = 10
Teste t comparando A e B: p=0,0123
20
22. Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder do teste estatístico: Capacidade do teste em
apontar diferenças quando elas realmente existem
Erro tipo II (β) = 10%
Poder = 1 – β = 90%
22
23. Delineamento inteiramente aleatorizado
Esquema da análise de variância:
Fonte de
variação
Tratamento
Resíduo
Total
Graus de
liberdade
Soma de Quadrados
Quadrado médio
F
I–1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
I (J – 1)
Por diferença
SQ resíduo
GL resíduo
-
IJ – 1
Variabilidade total
-
-
I = número de níveis do tratamento
J = número de repetições
Poder estatístico
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.
23
24. Princípios básicos da
experimentação
1. Repetição
2. Aleatorização
3. Cegamento
4. Controle local (blocos estatísticos)
Aleatorização
Proporciona a todos os tratamentos a
mesma probabilidade de serem
designados a qualquer das unidades
experimentais
24
27. Ao classificar por um
número aleatório,
automaticamente o
tratamento ficará
aleatorizado!
Portanto, os espécimes
1, 6, 7 e 8 devem receber
o tratamento 1, e assim
sucessivamente...
27
28. Aleatorização com restrição
A distribuição dos espécimes entre os
tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de blocos
dentais, é possível sorteá-los aos tratamentos de acordo
com sua dureza
E a média de dureza entre
os grupos apresenta-se
apresentahomogênea.
28
29. RealizandoRealizando-se a
aleatorização sem restrição,
as diferenças entre durezas
dos espécimes distribuídos
aos 4 níveis de tratamento
são mais evidentes.
Cegamento
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
29
30. Vieira, S. Estatística experimental. 2.ed. 1999
Cegamento
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Quando voluntários estão envolvidos, estes
também não devem saber de qual tratamento
estão participando – estudo duplo cego
30
31. Delineamento aleatorizado em
blocos
Utiliza os princípios da repetição,
aleatorização e controle local
Exemplo: avaliar o efeito do dentifrício fluoretado,
em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos
Delineamento aleatorizado em blocos
Modelo matemático:
Yij = µ + ti + bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento e
no j-ésimo bloco
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
bj = efeito do j-ésimo nível de voluntário
eij = erro aleatório
31
32. Delineamento aleatorizado em blocos
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Delineamento aleatorizado em blocos
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados
Quadrado médio
F
Tratamento
I–1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
Blocos
J–1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo
(I – 1)(J – 1)
Por diferença
SQ resíduo
GL resíduo
-
IJ – 1
Variabilidade total
-
-
Resíduo
Total
I = número de níveis do tratamento
J = número de blocos
32
33. Delineamento aleatorizado em blocos
A variabilidade devido aos blocos
(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)
33
34. Delineamento cruzado
Fase 1
Fase 2
Fase 3
Voluntários
grupo 1
Voluntários
grupo 2
Voluntários
grupo 3
Tratamento A
Tratamento B
Tratamento C
Delineamentos de tratamentos
1. Fatorial
2. Parcelas subdivididas
34
35. Experimentos fatoriais
Derivam do interesse em testar o efeito de
dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.
Experimentos fatoriais
Exemplo: avaliar o efeito do dentifrício
fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.
Fatorial 2 x 4
35
36. Experimentos fatoriais
A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500 ppm F, exposição ao açúcar 2x/dia
500 ppm F, exposição ao açúcar 4x/dia
500 ppm F, exposição ao açúcar 6x/dia
500 ppm F, exposição ao açúcar 8x/dia
1100 ppm F, exposição ao açúcar 2x/dia
1100 ppm F, exposição ao açúcar 4x/dia
1100 ppm F, exposição ao açúcar 6x/dia
1100 ppm F, exposição ao açúcar 8x/dia
Delineamento fatorial
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A e jésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
Bj = efeito do j-ésimo nível do fator B
Ai*Bj = efeito da interação A e B
eij = erro aleatório
36
37. Delineamento fatorial
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
Delineamento fatorial
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados
Quadrado médio
F
A
I–1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo
B
J–1
Variabilidade devido
ao fator B
SQ trat. B
GL trat. B
QM trat. B
QM resíduo
(I – 1)(J – 1)
Variabilidade devido
a interação A*B
SQ (A*B)
GL (A*B)
QM trat. A*B
QM resíduo
IJ (K– 1)
Por diferença
SQ resíduo
GL resíduo
-
IJ – 1
Variabilidade total
-
-
A*B
Resíduo
Total
I = número de níveis do fator A
J = número de níveis do fator B
K = número de repetições
37
38. Variável resposta
Não há efeito significativo
B1
de A (A1 = A2)
B2
Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
Variável resposta
A1
A2
Há efeito significativo de A
(A2 > A1)
B1
Não há efeito significativo
B2
de B (B1 = B2)
Não há efeito da interação
Variável resposta
A1
A2
Não há efeito significativo
B1
de A (A1 = A2)
Há efeito significativo de B
B2
(B1 > B2)
Não há efeito da interação
Variável resposta
A1
A2
Há efeito significativo de A
(A2 > A1)
B1
Há efeito significativo de B
(B1 > B2)
B2
Não há efeito da interação
A1
A2
38
39. Variável resposta
B1
diferença na grandeza da
B2
A1
Variável resposta
Interação devido a
resposta
A2
B1
Interação devido a
B2
diferença na direção da
resposta
A1
A2
39
40. Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequência
exposição do
biofilme à sacarose
2x
4x
6x
8x
Dentifrício A
Dentifrício B
5,6 ± 4,7
4,4 ± 1,3
5,1 ± 2,3
6,8 ± 7,2
7,2 ± 4,8
10,1 ± 12,8
8,2 ± 6,2
8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)
Experimentos em parcelas
subdivididas
Vieira, S. Estatística experimental. 2.ed. 1999
40
41. Experimentos em parcelas
subdivididas
Ocorrem quando os tratamentos não são distribuídos
nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).
Após o sorteio do tratamento principal às unidades
experimentais de forma usual, o tratamento secundário
é sorteado dentro de cada tratamento primário.
Baseline surface microhardness
41
42. Delineamento em parcelas subdivididas
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, jésimo bloco e k-ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
eij = erro aleatório
Delineamento fatorial
Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
42
43. Delineamento fatorial
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio
F
A
I–1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo a
Blocos
J–1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo a
(I – 1)(J – 1)
Variabilidade da
parcela
SQ resíduo a
GL resíduo a
Resíduo a
(A*bloco)
Delineamento fatorial
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio
F
A
I–1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo a
Blocos
J–1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo a
(I – 1)(J – 1)
Variabilidade da
parcela
SQ resíduo a
GL resíduo a
K–1
Variabilidade devido
ao fator B
SQ trat. B
GL trat. B
QM trat. B
QM resíduo b
A*B
(I – 1)(K – 1)
Variabilidade devido
a interação A*B
SQ (A*B)
GL (A*B)
QM trat. A*B
QM resíduo b
Resíduo b
I(J – 1)(K– 1)
Por diferença
SQ resíduo b
GL resíduo b
-
IJK – 1
Variabilidade total
-
-
Resíduo a
(A*bloco)
B
Total
43
46. “We
have
discussed
the
practice
of
using
different
data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”
“Sorry about the confusion induced by my last set of comments on
the statistics. I think there might be still some sort of problem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I will
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a misinterpretation of your analysis.”
46