1. +
Bioestatística - Universidade Católica de Brasília
Testes
Prof. Dr. Gabriel da Rocha Fernandes
Universidade Católica de Brasília
gabrielf@ucb.br - fernandes.gabriel@gmail.com
2. +
Introdução
2
nInferência estatística
n estimativa de parâmetros
n testes de hipóteses
nLevantamentos a fim de determinar o grau de aceitação de
hipóteses baseadas em teorias do comportamento.
nColeta de dados empíricos.
nCom base nestes dados decide-se então sobre a validade ou
não da hipótese.
nA decisão sobre a hipótese pode levar a rejeição, revisão ou
aceitação da teoria que a originou.
3. +
Metodologia
nConclusão é baseada na informação proporcionada pelos
dados.
nEnvolvem apenas parte da população que se pretende atingir.
n Definir a hipótese de igualdade (H0).
n Escolher a prova estatística (com o modelo estatístico associado) para
tentar rejeitar H0.
n Definir o nível de significância (α) e um tamanho de amostra (n).
n Determinar a distribuição amostral da prova estatística sob a hipótese
de nulidade.
n Definir a região de rejeição.
n Calcular o valor da prova estatística.
3
4. +
Hipóteses
nÉ uma suposição ou afirmação que pode ou não ser
verdadeira, relativa a uma ou mais populações.
nA veracidade ou falsidade sobre uma hipótese só pode ser dita
com certeza se estudarmos toda a população.
nA decisão de que a amostra é provavelmente verdadeira ou
falsa utiliza as distribuições amostrais.
nDuas hipóteses:
n Nula (H0)
n Alternativa (H1)
4
5. +
Hipóteses
nA hipótese nula é a hipótese de igualdade.
nFormulada com o objetivo de ser rejeitada.
nA rejeição da hipótese nula envolve a aceitação de outra
hipótese.
nHipótese alternativa é a definição operacional da hipótese de
pesquisa que se deseja comprovar.
nA natureza do estudo define a hipótese alternativa.
nEm um teste paramétrico de parâmetro θ
n H1 : θ = θ1 (Hipótese alternativa simples)
n H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas)
5
6. +
Escolha do teste
nParamétricos e não paramétricos.
nConjunto valores numéricos.
nTamanho da amostra disponível.
nO teste é válido somente para aquelas condições.
nDefinição do nível de significância.
6
7. +
Distribuição amostral
nTestes de hipótese obedecem modelos específicos.
nDistribuição normal > shapiro.test()
nDistribuição T Student
nDistribuição Qui-quadrado
nDistribuição F
7
8. +
Hipoteses
nH1: θ = θ2 (hipótese simples)
nH1: θ > θ0 (teste unilateral ou unicaudal à direita)
nθ < θ0 (teste unilateral ou unicaudal à esquerda)
nθ ≠ θ0 (teste bilateral ou bicaudal)
8
9. +
Testes paramétricos
nLower Tail Test da média populacional com variância
conhecida
nHipótese nula:
n > xbar = 9900 # sample mean
n> mu0 = 10000 # hypothesized value
n> sigma = 120 # population standard deviation
n> n = 30 # sample size
n> z = (xbar−mu0)/(sigma/sqrt(n))
n> z # test statistic
n> alpha = .05
n> z.alpha = qnorm(1−alpha)
n> −z.alpha # critical value
9
10. +
Testes paramétricos
nTwo tailed test com variância conhecida
n> xbar = 14.6 # sample mean
n> mu0 = 15.4 # hypothesized value
n> sigma = 2.5 # population standard deviation
n> n = 35 # sample size
n> z = (xbar−mu0)/(sigma/sqrt(n))
n> z # test statistic
n> alpha = .05
n> z.half.alpha = qnorm(1−alpha/2)
n> c(−z.half.alpha, z.half.alpha)
n> pval = 2 ∗ pnorm(z) # lower tail
n> pval # two−tailed p−value
10
11. +
Não conheço a variância
n> xbar = 9900 # sample mean
n> mu0 = 10000 # hypothesized value
n> s = 125 # sample standard deviation
n> n = 30 # sample size
n> t = (xbar−mu0)/(s/sqrt(n))
n> t # test statistic
n> alpha = .05
n> t.alpha = qt(1−alpha, df=n−1)
n> −t.alpha # critical value
n> pval = pt(t, df=n−1)
n> pval # lower tail p−value
11
13. +
Teste T para amostras
independentes
nUtilizamos a distribuição de t quando não temos os parâmetros
populacionais (σ e µ).
nPremissas: Normalidade, Homocedasticidade (razão das
variâncias = 1 ou variâncias iguais), Independência dos dados
13
Premissas do teste t Alternativa caso haja violação de
premissas
Independência Amostras Pareadas
Variâncias Iguais Correção dos Graus de Liberdade
Normalidade Testes não-paramétricos
14. +
Teste T pareado
nUtilizado com duas amostras retiradas do mesmo objeto.
nTratamento em pessoas (antes e depois), ou peso de animais
(seca e chuva)
nDesde que sejam os mesmos indivíduos os dados podem ser
tratados como pareados.
nTeste não paramétrico do teste t é o Teste de Mann-Whitney.
nPara teste t pareado, o não paramétrico é Wilcoxon
14
16. +
Exemplos
n Utiliza o teste t pareado para testar a hipótese de que a estação do ano
influenciou o peso dos mesmos indivíduos (considerando agora que os
mesmos indivíduos foram pesados nas duas estações)
n >t.test(chuva, seca, paired=T)
n Testa se a massa na chuva é maior ou igual à massa na seca, considerando
que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“l”))
n Testa se a massa na chuva é menor ou igual à massa na seca,
considerando que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“g”))
n Testa a igualdade das medias da massa nas duas estações, com o método
não-paramétrico, considerando que os dados são pareados
n >wilcox.test(chuva,seca,paired=T)
16