O documento discute conceitos estatísticos importantes para a escolha do método estatístico adequado em pesquisas, incluindo tipos de testes estatísticos, delineamentos experimentais, aleatorização, hipóteses estatísticas, análise de variância e poder estatístico.
1. 1
Profa. Dra. Livia M. A. Tenuta
litenuta@fop.unicamp.br
Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba
A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -
2. 2
“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983
Para muitos, estatística é...
3. 3
Figueira CV, 2006
“Estatística é a arte de torturar
os dados até que eles digam o
que se quer ouvir”
Mills, 1993,
Susin & Rösing, 1999
Para outros...
5. 5
Testes estatísticos mais comuns
Número e tipo de grupos Paramétrico Não paramétrico
2 grupos
Independentes
(não pareados)
Teste t para
amostras
independentes
Teste de Mann-
Whitney
Dependentes
(pareados)
Teste t para
amostras
dependentes
Teste de Wilcoxon
3 ou mais grupos
Independentes
(não pareados)
ANOVA Teste de Kruskal-
Wallis
Dependentes
(pareados)
ANOVA medidas
repetidas
Teste de Friedman
Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
Métodos de regressão mais comuns
Tipo de observações Dados contínuos Dados categóricos
Independentes Regressão linear
Regressão logística
dicotômica, multinomial e
ordenada
Dependentes
Regressão linear com erro
padrão ajustado para o
agrupamento das
observações
Regressão logística
condicional e extensões
Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009
6. 6
Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose
• Controle ativo: 1.5% Lactose
• Experimental: Zero CalR
• Controle negativo: sem dentifrício
• Controle ativo: MFP/SiO2
• Experimental: MFP/CaCO3
Pergunta (???) – curiosidade científica!
Delineamento experimental adequado
para testar a pergunta
Variáveis resposta que ajudem a
explicar o fenômeno
Pesquisa científica
7. 7
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
Diferença estimada entre A e B: 8%
Estatística experimental
Existe uma real diferença entre os
tratamentos A e B?
Para descobrir, o experimento deveria
ser repetido infinitas vezes!
8. 8
Inferência estatística: determina a
probabilidade de estimar se uma real
diferença entre tratamentos existe
Estatística experimental
Nível de significância (p): probabilidade
de erro ao afirmar que há diferença entre
os tratamentos
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
DP 7,3%
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
DP 3,9%
9. 9
Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média
ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento
10. 10
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)
Dentifrício A Dentifrício B
5,5 11,4
Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média ± DP, n=56)
Dentifrício A Dentifrício B
5,5 ± 4,5 11,4 ± 21,0
14. 14
Esquema da análise de variância:
Delineamento inteiramente aleatorizado
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
Resíduo I (J – 1) Por diferença
SQ resíduo
GL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de repetições
Modelo matemático:
Yij = µ + ti + eij
Delineamento inteiramente aleatorizado
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
eij = erro aleatório
15. 15
280 ppm F
140 ppm F
70 ppm FControle
Teste de hipóteses: regra de decisão para
rejeitar ou não uma hipótese estatística
com base nos elementos amostrais
Estatística experimental
H0 (hipótese nula): hipótese que será testada
estatisticamente
Ha (hipótese alternativa): suposição que o
pesquisador quer estudar
16. 16
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Delineamento inteiramente aleatorizado
Ao rejeitar H0, com nível de significância
de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa
Estatística experimental
17. 17
“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”
Fisher RA
Tratamento A:
21,5%
23,6%
39,7%
29,5%
32,7%
Média 29,4%
Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento B:
18,9%
24,4%
26,7%
19,4%
17,8%
Média 21,4%
Erro tipo I (α): probabilidade de erro ao se rejeitar a
hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo
Diferem ao
nível de
significância
de 5%
18. 18
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
Trabalhando com probabilidades...
Correlação entre variáveis: se eu tiver 10 variáveis
e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)
Em 5% delas, posso ver uma correlação
significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
É função do:
a) número de repetições
b) variabilidade dos dados
c) real diferença entre os grupos
19. 19
Proporciona uma estimativa do erro
experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.
Repetição
Repetição
n=3
Tratamento A:
20
24
25
Média 23
Tratamento B:
17
22
24
Média 21
Teste t comparando A e B: p=0,48
20. 20
Repetição
n=30
Tratamento A:
20, 24, 25, 21, 23,20, 24, 25, 21, 23,
25, 20, 23, 26, 20,25, 20, 23, 26, 20,
24, 25, 20, 24, 25,24, 25, 20, 24, 25,
22, 24, 23, 21, 23,22, 24, 23, 21, 23,
26, 19, 24, 25, 20,26, 19, 24, 25, 20,
24, 25, 19, 25, 2524, 25, 19, 25, 25
Média 23
Tratamento B:
15, 22, 26, 16, 23,15, 22, 26, 16, 23,
24, 15, 24, 24, 17,24, 15, 24, 24, 17,
22, 24, 17, 22, 24,22, 24, 17, 22, 24,
17, 16, 22, 24, 23,17, 16, 22, 24, 23,
24, 17, 22, 24, 17,24, 17, 22, 24, 17,
22, 24, 14, 24, 2522, 24, 14, 24, 25
Média 21
Teste t comparando A e B: p=0,0137
Repetição
n=3
Tratamento A:
20
24
25
Média 23
Tratamento B:
10
13
16
Média 13
Teste t comparando A e B: p=0,0123
Diferença entre A e B = 10
21. 21
Repetição
n=3
Tratamento A:
20
24
25
Média 23
DP 2,6
Tratamento B:
10
13
16
Média 13
DP 3,0
Repetição
n=3
Tratamento A:
13
21
35
Média 23
DP 11,1
Tratamento B:
5
10
24
Média 13
DP 9,9
Teste t comparando A e B: p=0,31
22. 22
Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder do teste estatístico: Capacidade do teste em
apontar diferenças quando elas realmente existem
Erro tipo II (β) = 10%
Poder = 1 – β = 90%
23. 23
Esquema da análise de variância:
Delineamento inteiramente aleatorizado
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
Resíduo I (J – 1) Por diferença
SQ resíduo
GL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de repetições
Poder estatístico
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
24. 24
1. Repetição
2. Aleatorização
3. Cegamento
4. Controle local (blocos estatísticos)
Princípios básicos da
experimentação
Proporciona a todos os tratamentos a
mesma probabilidade de serem
designados a qualquer das unidades
experimentais
Aleatorização
26. 26
Classificar pela colunaClassificar pela coluna
“Aleatório”“Aleatório”
ATENÇÃO: Para que o sorteio sejaATENÇÃO: Para que o sorteio seja
feito corretamente, apenas asfeito corretamente, apenas as
colunas “Tratamento” ecolunas “Tratamento” e
“Aleatório” devem ser“Aleatório” devem ser
selecionadas!selecionadas!
27. 27
Ao classificar por umAo classificar por um
número aleatório,número aleatório,
automaticamente oautomaticamente o
tratamento ficarátratamento ficará
aleatorizado!aleatorizado!
Portanto, os espécimesPortanto, os espécimes
1, 6, 7 e 8 devem receber1, 6, 7 e 8 devem receber
o tratamento 1, e assimo tratamento 1, e assim
sucessivamente...sucessivamente...
28. 28
A distribuição dos espécimes entre os
tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de blocos
dentais, é possível sorteá-los aos tratamentos de acordo
com sua dureza
Aleatorização com restrição
E a média de dureza entreE a média de dureza entre
os grupos apresentaos grupos apresenta--sese
homogênea.homogênea.
29. 29
RealizandoRealizando--se ase a
aleatorizaçãoaleatorização sem restrição,sem restrição,
as diferenças entre durezasas diferenças entre durezas
dos espécimes distribuídosdos espécimes distribuídos
aos 4 níveis de tratamentoaos 4 níveis de tratamento
são mais evidentes.são mais evidentes.
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Cegamento
30. 30
Vieira, S. Estatística experimental. 2.ed. 1999
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Quando voluntários estão envolvidos, estes
também não devem saber de qual tratamento
estão participando – estudo duplo cego
Cegamento
31. 31
Utiliza os princípios da repetição,
aleatorização e controle local
Exemplo: avaliar o efeito do dentifrício fluoretado,
em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos
Delineamento aleatorizado em
blocos
Modelo matemático:
Yij = µ + ti + bj + eijk
Delineamento aleatorizado em blocos
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento e
no j-ésimo bloco
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
bj = efeito do j-ésimo nível de voluntário
eij = erro aleatório
32. 32
Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0
Delineamento aleatorizado em blocos
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
Tratamento I – 1
Variabilidade devido
ao tratamento
SQ tratamento
GL trat.
QM tratamento
QM resíduo
Blocos J – 1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo
Resíduo (I – 1)(J – 1) Por diferença
SQ resíduo
GL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do tratamento
J = número de blocos
Delineamento aleatorizado em blocos
33. 33
A variabilidade devido aos blocos
(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)
Delineamento aleatorizado em blocos
34. 34
Fase 1
Delineamento cruzado
Fase 2 Fase 3
Voluntários
grupo 1
Voluntários
grupo 2
Voluntários
grupo 3
Tratamento ATratamento A Tratamento BTratamento B Tratamento CTratamento C
1. Fatorial
2. Parcelas subdivididas
Delineamentos de tratamentos
35. 35
Derivam do interesse em testar o efeito de
dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.
Experimentos fatoriais
Exemplo: avaliar o efeito do dentifrício
fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.
Experimentos fatoriais
Fatorial 2 x 4
36. 36
A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500500 ppmppm FF, exposição ao açúcar 2x/dia
500500 ppmppm FF, exposição ao açúcar 4x/dia
500500 ppmppm FF, exposição ao açúcar 6x/dia
500500 ppmppm FF, exposição ao açúcar 8x/dia
11001100 ppmppm FF, exposição ao açúcar 2x/dia
11001100 ppmppm FF, exposição ao açúcar 4x/dia
11001100 ppmppm FF, exposição ao açúcar 6x/dia
11001100 ppmppm FF, exposição ao açúcar 8x/dia
Experimentos fatoriais
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Delineamento fatorial
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A e j-
ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
Bj = efeito do j-ésimo nível do fator B
Ai*Bj = efeito da interação A e B
eij = erro aleatório
37. 37
Hipóteses:
Delineamento fatorial
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
A I – 1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo
B J – 1
Variabilidade devido
ao fator B
SQ trat. B
GL trat. B
QM trat. B
QM resíduo
A*B (I – 1)(J – 1)
Variabilidade devido
a interação A*B
SQ (A*B)
GL (A*B)
QM trat. A*B
QM resíduo
Resíduo IJ (K– 1) Por diferença
SQ resíduo
GL resíduo
-
Total IJ – 1 Variabilidade total - -
I = número de níveis do fator A
J = número de níveis do fator B
K = número de repetições
Delineamento fatorial
38. 38
A1 A2
Variávelresposta
B2
B1
Não há efeito significativo
de A (A1 = A2)
Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Variávelresposta
B2
B1
Há efeito significativo de A
(A2 > A1)
Não há efeito significativo
de B (B1 = B2)
Não há efeito da interação
A1 A2
Variávelresposta
B2
B1 Há efeito significativo de A
(A2 > A1)
Há efeito significativo de B
(B1 > B2)
Não há efeito da interação
A1 A2
Variávelresposta
B2
B1
Não há efeito significativo
de A (A1 = A2)
Há efeito significativo de B
(B1 > B2)
Não há efeito da interação
39. 39
A1 A2
Variávelresposta
B2
B1 Interação devido a
diferença na direção da
resposta
A1 A2
Variávelresposta
B2
B1 Interação devido a
diferença na grandeza da
resposta
40. 40
Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequência
exposição do
biofilme à sacarose
Dentifrício A Dentifrício B
2 x 5,6 ± 4,7 7,2 ± 4,8
4 x 4,4 ± 1,3 10,1 ± 12,8
6 x 5,1 ± 2,3 8,2 ± 6,2
8 x 6,8 ± 7,2 8,0 ± 6,4
Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)
Experimentos em parcelas
subdivididas
Vieira, S. Estatística experimental. 2.ed. 1999
41. 41
Ocorrem quando os tratamentos não são distribuídos
nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).
Após o sorteio do tratamento principal às unidades
experimentais de forma usual, o tratamento secundário
é sorteado dentro de cada tratamento primário.
Experimentos em parcelas
subdivididas
Baseline surface microhardness
42. 42
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Delineamento em parcelas subdivididas
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, j-
ésimo bloco e k-ésimo nível do fator B
µ = média geral do experimento para a variável
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B
eij = erro aleatório
Hipóteses:
Delineamento fatorial
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0
43. 43
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
A I – 1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo a
Blocos J – 1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo a
Resíduo a
(A*bloco)
(I – 1)(J – 1)
Variabilidade da
parcela
SQ resíduo a
GL resíduo a
Delineamento fatorial
Esquema da análise de variância:
Fonte de
variação
Graus de
liberdade
Soma de Quadrados Quadrado médio F
A I – 1
Variabilidade devido
ao fator A
SQ trat. A
GL trat. A
QM trat. A
QM resíduo a
Blocos J – 1
Variabilidade devido
aos blocos
SQ blocos
GL blocos
QM blocos
QM resíduo a
Resíduo a
(A*bloco)
(I – 1)(J – 1)
Variabilidade da
parcela
SQ resíduo a
GL resíduo a
B K – 1
Variabilidade devido
ao fator B
SQ trat. B
GL trat. B
QM trat. B
QM resíduo b
A*B (I – 1)(K – 1)
Variabilidade devido
a interação A*B
SQ (A*B)
GL (A*B)
QM trat. A*B
QM resíduo b
Resíduo b I(J – 1)(K– 1) Por diferença
SQ resíduo b
GL resíduo b
-
Total IJK – 1 Variabilidade total - -
Delineamento fatorial
46. 46
“We have discussed the practice of using different data
transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”
“Sorry about the confusion induced by my last set of comments on
the statistics. I think there might be still some sort of problem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I will
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a mis-
interpretation of your analysis.”