A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)

Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba

A escolha do método
estatístico

Profa. Dra. Livia M. A. Tenuta
litenuta@fop.unicamp.br

Universidade Estadual de Campinas
Faculdade de Odontologia de Piracicaba

A escolha do método
estatístico
- Probabilidades, hipóteses e
delineamentos -

1

“A notícia boa é que a estatística
está se tornando mais fácil e
acessível.
A notícia ruim é que a estatística
está se tornando mais fácil e
acessível.”
Hofacker, 1983

Para muitos, estatística é...

2

Figueira CV, 2006

Para outros...

“Estatística é a arte de torturar
os dados até que eles digam o
que se quer ouvir”
Mills, 1993,
Susin & Rösing, 1999

3

Jim Borgman, New York Times, 27 April 1997

4

Testes estatísticos mais comuns
Número e tipo de grupos
Independentes
(não pareados)
2 grupos

Dependentes
(pareados)
Independentes
(não pareados)

3 ou mais grupos

Dependentes
(pareados)

Paramétrico

Não paramétrico

Teste t para
amostras
independentes

Teste de MannWhitney

Teste t para
amostras
dependentes

Teste de Wilcoxon

ANOVA

Teste de KruskalWallis

ANOVA medidas
repetidas

Teste de Friedman

Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Métodos de regressão mais comuns
Tipo de observações

Dados contínuos

Dados categóricos

Independentes

Regressão linear

Regressão logística
dicotômica, multinomial e
ordenada

Dependentes

Regressão linear com erro
padrão ajustado para o
agrupamento das
observações

Regressão logística
condicional e extensões

Susin C. Basic statistical analysis for dental research.
In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

5

Estudo cruzado duplo-cego
• Controle negativo: H2O
• Controle positivo: 1.5% Sacarose

• Controle negativo: sem dentifrício

• Controle ativo: 1.5% Lactose

• Controle ativo: MFP/SiO2

• Experimental: Zero

CalR

• Experimental: MFP/CaCO3

Pesquisa científica
Pergunta (???) – curiosidade científica!
Delineamento experimental adequado
para testar a pergunta
Variáveis resposta que ajudem a
explicar o fenômeno

6

Estatística experimental
Desmineralização dental (% perda de dureza)
Tratamento A:

Tratamento B:

21,5%

18,9%

23,6%

24,4%

39,7%

26,7%

29,5%

19,4%

32,7%

17,8%

Média

29,4%

Média

21,4%

Diferença estimada entre A e B: 8%

Existe uma real diferença entre os
tratamentos A e B?
Para descobrir, o experimento deveria
ser repetido infinitas vezes!

7

Inferência estatística: determina a
probabilidade de estimar se uma real
diferença entre tratamentos existe
Nível de significância (p): probabilidade
de erro ao afirmar que há diferença entre
os tratamentos

Tratamento A:

Tratamento B:

21,5%

18,9%

23,6%

24,4%

39,7%

26,7%

29,5%

19,4%

32,7%

17,8%

Média
DP

29,4%
7,3%

Média
DP

21,4%
3,9%

8

Variação do acaso: toda variação devido a fatores
não controláveis. Pode ser medida através do
desvio em relação a média

ANOVA
Análise da variância
Quanto da variabilidade observada
é devido ao acaso ou a um real
efeito do tratamento

9

Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média, n=56)

Dentifrício A
5,5

Dentifrício B
11,4

Efeito de 2 dentifrícios na concentração de
F no fluido do biofilme
(µM F, média ± DP, n=56)

Dentifrício A
5,5 ± 4,5

Dentifrício B
11,4 ± 21,0

10

Concentração de F no fluido do
biofilme dental exposto a 2 dentifrícios

11

Transformação sugerida pelo pacote
estatístico: inversa

13

Delineamento inteiramente aleatorizado

Esquema da análise de variância:
Fonte de
variação
Tratamento
Resíduo
Total

Graus de
liberdade

Soma de Quadrados

Quadrado médio

F

I–1

Variabilidade devido
ao tratamento

SQ tratamento
GL trat.

QM tratamento
QM resíduo

I (J – 1)

Por diferença

SQ resíduo
GL resíduo

-

IJ – 1

Variabilidade total

-

-

I = número de níveis do tratamento
J = número de repetições

Modelo matemático:
Yij = µ + ti + eij
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento
µ = média geral do experimento para a variável
ti = efeito do i-ésimo nível de tratamento
eij = erro aleatório

14

Controle

70 ppm F

140 ppm F

280 ppm F

Teste de hipóteses: regra de decisão para
rejeitar ou não uma hipótese estatística
com base nos elementos amostrais
H0 (hipótese nula): hipótese que será testada
estatisticamente
Ha (hipótese alternativa): suposição que o
pesquisador quer estudar

15


Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0


Ao rejeitar H0, com nível de significância
de 5%, por exemplo, o pesquisador
automaticamente aceita sua hipótese
alternativa

16

“In relation to any experiment we may speak of…
the “null hypothesis,” and it should be noted that
the null hypothesis is never proved or established,
but is possibly disproved, in the course of
experimentation. Every experiment may be said to
exist only in order to give the facts a chance of
disproving the null hypothesis.”

Fisher RA

Tratamento A:

Tratamento B:

21,5%

18,9%

23,6%

24,4%

39,7%

26,7%

nível de

29,5%

19,4%

significância

32,7%

17,8%

de 5%

Média

29,4%

Média

Diferem ao

21,4%

Erro tipo I (α): probabilidade de erro ao se rejeitar a
hipótese de nulidade quando ela é verdadeira, ou
seja, probabilidade de apontar um falso positivo

17

Trabalhando com probabilidades...
Nível de significância de 5% significa que
aceitamos errar em 1 a cada 20 casos
Correlação entre variáveis: se eu tiver 10 variáveis
e for estudar a correlação entre elas, tenho 45
comparações (10*(10-1)/2 = 45)
Em 5% delas, posso ver uma correlação
significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983

Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo

É função do:
a) número de repetições
b) variabilidade dos dados
c) real diferença entre os grupos

18

Repetição

Proporciona uma estimativa do erro
experimental (variabilidade), permitindo a
estimativa do efeito dos tratamentos.

Repetição
n=3
Tratamento A:

Tratamento B:

20

17

24

22

25

24

Média

23

Média

21

Teste t comparando A e B: p=0,48

19

Repetição
n=30
Tratamento A:

Tratamento B:

20, 24, 25, 21, 23,
25, 20, 23, 26, 20,
24, 25, 20, 24, 25,
22, 24, 23, 21, 23,
26, 19, 24, 25, 20,
24, 25, 19, 25, 25

15, 22, 26, 16, 23,
24, 15, 24, 24, 17,
22, 24, 17, 22, 24,
17, 16, 22, 24, 23,
24, 17, 22, 24, 17,
22, 24, 14, 24, 25

Média

23

Média

21


Repetição
n=3
Tratamento A:

Tratamento B:

20

10

24

13

25

16

Média

23

Média

13

Diferença entre A e B = 10


20

Repetição
n=3
Tratamento A:

Tratamento B:

20

10

24

13

25

16

Média

23

Média

13

DP

2,6

DP

3,0

Repetição
n=3
Tratamento A:

Tratamento B:

13

5

21

10

35

24

Média
DP

23
11,1

Média

13

DP

9,9


21

Poder estatístico
Erro tipo II (β): probabilidade de erro ao não
rejeitar a hipótese de nulidade quando ela é de
fato falsa, ou seja, probabilidade de apontar um
falso negativo
Poder do teste estatístico: Capacidade do teste em
apontar diferenças quando elas realmente existem
Erro tipo II (β) = 10%
Poder = 1 – β = 90%

22


Fonte de
variação
Tratamento
Resíduo
Total

Graus de
liberdade

Soma de Quadrados

Quadrado médio

F

I–1

ao tratamento

SQ tratamento
GL trat.

QM tratamento
QM resíduo

I (J – 1)

Por diferença

SQ resíduo
GL resíduo

-

IJ – 1

Variabilidade total

-

-

J = número de repetições

Poder estatístico
Reviewer: What were criteria for sample size selection? Was
it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers,
who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after
lunch, and we used the AUC of salivary F concentration as the response
variable. In fact, we intended to determine the number of volunteers necessary
to detect differences between the gastric content situations using the low F
dentifrice, with 80% power. From this pilot study, a low standard deviation was
observed between volunteers for each gastric content condition. Using the
SAS System 8.01, considering the differences obtained from the mean of these
treatments, we could reach 80% power if we used nine volunteers. For 11
volunteers, the power would increase to 90%. Considering that volunteers
could be lost during the 9-phase study, we opted to select 11 volunteers.
Actually, we could significantly reject H0 in the experiment, and therefore we
haven’t worried in mention this in the text, but we added the power
information in the text.

23

Princípios básicos da
experimentação
1. Repetição
2. Aleatorização
3. Cegamento
4. Controle local (blocos estatísticos)

Aleatorização

Proporciona a todos os tratamentos a
mesma probabilidade de serem
designados a qualquer das unidades
experimentais

24

Aleatorização = sorteio!

Aleatorização no Excel

Exemplo:
Dividir 16 espécimes em 4 tratamentos
(cada um com 4 espécimes)

25

Classificar pela coluna
“Aleatório”

ATENÇÃO: Para que o sorteio seja
feito corretamente, apenas as
colunas “Tratamento” e
“Aleatório” devem ser
selecionadas!

26

Ao classificar por um
número aleatório,
automaticamente o
tratamento ficará
aleatorizado!

Portanto, os espécimes
1, 6, 7 e 8 devem receber
o tratamento 1, e assim
sucessivamente...

27

Aleatorização com restrição
A distribuição dos espécimes entre os
tratamentos é feita de modo restrito, para
evitar que algum tratamento seja
favorecido pela aleatorização.
Exemplo: quando se conhece a dureza inicial de blocos
dentais, é possível sorteá-los aos tratamentos de acordo
com sua dureza

E a média de dureza entre
os grupos apresenta-se
apresentahomogênea.

28

RealizandoRealizando-se a
aleatorização sem restrição,
as diferenças entre durezas
dos espécimes distribuídos
aos 4 níveis de tratamento
são mais evidentes.

Cegamento
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.

29

Vieira, S. Estatística experimental. 2.ed. 1999

Cegamento
Estudo cego: o pesquisador não tem acesso
à identificação de qual nível de tratamento se
trata.
Quando voluntários estão envolvidos, estes
também não devem saber de qual tratamento
estão participando – estudo duplo cego

30

Delineamento aleatorizado em
blocos
Utiliza os princípios da repetição,
aleatorização e controle local
Exemplo: avaliar o efeito do dentifrício fluoretado,
em 2 níveis, na concentração de F na saliva,
utilizando 14 voluntários como blocos estatísticos

Delineamento aleatorizado em blocos
Modelo matemático:
Yij = µ + ti + bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível de tratamento e
no j-ésimo bloco
ti = efeito do i-ésimo nível de tratamento
bj = efeito do j-ésimo nível de voluntário

31


Hipóteses:
H0 = t1 = t2 = ... = tI = 0
Ha = ti ≠ 0

Fonte de
variação

Graus de
liberdade

Soma de Quadrados

Quadrado médio

F

Tratamento

I–1

ao tratamento

SQ tratamento
GL trat.

QM tratamento
QM resíduo

Blocos

J–1

aos blocos

SQ blocos
GL blocos

QM blocos
QM resíduo

(I – 1)(J – 1)

Por diferença

SQ resíduo
GL resíduo

-

IJ – 1

Variabilidade total

-

-

Resíduo
Total

J = número de blocos

32


A variabilidade devido aos blocos
(voluntários, p.ex.) pode ser estimada,
diminuindo a variabilidade devido ao
acaso (erro experimental)

33

Delineamento cruzado
Fase 1

Fase 2

Fase 3

Voluntários
grupo 1
Voluntários
grupo 2
Voluntários
grupo 3
Tratamento A

Tratamento B

Tratamento C

Delineamentos de tratamentos
1. Fatorial
2. Parcelas subdivididas

34

Experimentos fatoriais
Derivam do interesse em testar o efeito de
dois ou mais tipos de tratamentos no
mesmo experimento. Cada tipo de
tratamento é referido como um fator.

Exemplo: avaliar o efeito do dentifrício
fluoretado, em 2 níveis, e da freqüência de
exposição do biofilme dental a sacarose,
em 4 níveis, na desmineralização dental.
Fatorial 2 x 4

35

A combinação de tratamentos resultantes é o resultado
da interação dos fatores a serem testados. No exemplo,
há 8 combinações possíveis de tratamentos:
500 ppm F, exposição ao açúcar 2x/dia

Delineamento fatorial
Modelo matemático:
Yij = µ + Ai + Bj + Ai*Bj + eijk
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A e jésimo nível do fator B
Ai = efeito do i-ésimo nível do fator A
Bj = efeito do j-ésimo nível do fator B
Ai*Bj = efeito da interação A e B

36

Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0

Fonte de
variação

Graus de
liberdade

Soma de Quadrados

Quadrado médio

F

A

I–1

ao fator A

SQ trat. A
GL trat. A

QM trat. A
QM resíduo

B

J–1

ao fator B

SQ trat. B
GL trat. B

QM trat. B
QM resíduo

(I – 1)(J – 1)

a interação A*B

SQ (A*B)
GL (A*B)

QM trat. A*B
QM resíduo

IJ (K– 1)

Por diferença

SQ resíduo
GL resíduo

-

IJ – 1

Variabilidade total

-

-

A*B
Resíduo
Total

I = número de níveis do fator A
J = número de níveis do fator B
K = número de repetições

37

Variável resposta

Não há efeito significativo
B1

de A (A1 = A2)
B2

de B (B1 = B2)
Não há efeito da interação

Variável resposta

A1

A2

Há efeito significativo de A
(A2 > A1)
B1


B2

de B (B1 = B2)

Variável resposta

A1

A2


B1

de A (A1 = A2)
Há efeito significativo de B

B2

(B1 > B2)

Variável resposta

A1

A2

Há efeito significativo de A
(A2 > A1)

B1

Há efeito significativo de B
(B1 > B2)

B2

A1

A2

38

Variável resposta

B1

diferença na grandeza da
B2

A1
Variável resposta

Interação devido a

resposta

A2

B1

Interação devido a
B2

diferença na direção da
resposta

A1

A2

39

Efeito de 2 dentifrícios na concentração de F no
fluido do biofilme em função da freqüência de
exposição a sacarose
(µM F, média ± DP, n=14)
Frequência
exposição do
biofilme à sacarose
2x
4x
6x
8x

Dentifrício A

Dentifrício B

5,6 ± 4,7
4,4 ± 1,3
5,1 ± 2,3
6,8 ± 7,2

7,2 ± 4,8
10,1 ± 12,8
8,2 ± 6,2
8,0 ± 6,4

Houve efeito significativo do fator dentifrício na concentração de F no
fluido do biofilme dental (p<0,05)

Experimentos em parcelas
subdivididas

Vieira, S. Estatística experimental. 2.ed. 1999

40

Experimentos em parcelas
subdivididas
Ocorrem quando os tratamentos não são distribuídos
nas unidades experimentais da mesma forma,
caracterizando tratamentos primários (parcelas) e
secundários (subparcelas).
Após o sorteio do tratamento principal às unidades
experimentais de forma usual, o tratamento secundário
é sorteado dentro de cada tratamento primário.

Baseline surface microhardness

41

Delineamento em parcelas subdivididas
Modelo matemático:
Yij = µ + Ai + bj + Bk + Ai*Bk + eijkl
Onde:
Yij = valor da variável testada sob o i-ésimo nível do fator A, jésimo bloco e k-ésimo nível do fator B
Ai = efeito do i-ésimo nível do fator A
bj = efeito do j-ésimo bloco estatístico
Bj = efeito do k-ésimo nível do fator B
Ai*Bk = efeito da interação A e B

Hipóteses:
(1) H0 = A1 = A2 = ... = AI = 0
Ha = Ai ≠ 0
(2) H0 = B1 = B2 = ... = BJ = 0
Ha = Bj ≠ 0
(3) H0 = (A*B)ij = 0
Ha = (A*B)ij ≠ 0

42

Fonte de
variação

Graus de
liberdade

Soma de Quadrados Quadrado médio

F

A

I–1

ao fator A

SQ trat. A
GL trat. A

QM trat. A
QM resíduo a

Blocos

J–1

aos blocos

SQ blocos
GL blocos

QM blocos
QM resíduo a

(I – 1)(J – 1)

Variabilidade da
parcela

SQ resíduo a
GL resíduo a

Resíduo a
(A*bloco)

Fonte de
variação

Graus de
liberdade

Soma de Quadrados Quadrado médio

F

A

I–1

ao fator A

SQ trat. A
GL trat. A

QM trat. A
QM resíduo a

Blocos

J–1

aos blocos

SQ blocos
GL blocos

QM blocos
QM resíduo a

(I – 1)(J – 1)

Variabilidade da
parcela

SQ resíduo a
GL resíduo a

K–1

ao fator B

SQ trat. B
GL trat. B

QM trat. B
QM resíduo b

A*B

(I – 1)(K – 1)

a interação A*B

SQ (A*B)
GL (A*B)

QM trat. A*B
QM resíduo b

Resíduo b

I(J – 1)(K– 1)

Por diferença

SQ resíduo b
GL resíduo b

-

IJK – 1

Variabilidade total

-

-

Resíduo a
(A*bloco)
B

Total

43

“We

have

discussed

the

practice

of

using

different

data

transformations within a 2-way ANOVA with our statistical adviser and
he stated that this is not valid, since the comparisons are not then
between data of the same type. Transformation is performed to deal
with 1 or more of 3 problems: non-normality, non-homogeneity of
variance and non-additivity. To my understanding, in a 2-way analysis,
'individualized' transformations, while solving the first two problems,
would work against the third requirement of ANOVA, that treatment
effects are additive. For instance, data in which treatment effect was
multiplicative rather than additive are appropriately transformed to
logs, since the treatment effects then become additive. But these
could not then be compared with data that had not been transformed
because they already fulfilled the ANOVA requirements. You would be
comparing oranges and bananas.”

“Sorry about the confusion induced by my last set of comments on
the statistics. I think there might be still some sort of problem there, in
that your comparison of the 30-min plaque solid data is on a
somewhat different basis from the other comparisons. But I will
discuss it when I next see our statistical advisor. I suspect that I put
the question to him in a misleading way, combined with a misinterpretation of your analysis.”

46

Obrigada
pela atenção!!!

litenuta@fop.unicamp.br

47

A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)

Similar a A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp) (20)

A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unicamp)