SlideShare una empresa de Scribd logo
1 de 29
Universidade Tecnológica Federal do Paraná
Probabilidade e Estatística
Inferência: Testes de Hipóteses e
conceitos elementares
Prof. Dr. Matheus Henrique Dal Molin Ribeiro
Departamento de Matemática
Câmpus Pato Branco
População x Amostra
População
População: Conjunto de elementos que tem pelo menos uma característica em
comum. Esta característica deve delimitar corretamente quais são os elementos da
população que podem ser animados ou inanimados.
Amostra: Subconjunto não vazio da População.
Amostra
Amostragem
Inferência
Inferência Estatística
Inferência
Estimação
Testes de
Hipóteses
Etapa destinada a obter
uma única estimativa
(estimação pontual) ou um
conjunto de estimativas
(estimação intervalar)
para um parâmetro.
É um procedimento para se
testar uma afirmativa sobre
uma propriedade da
população
Generalizações sobre
as características de
uma população a
partir da informação
contida na amostra
Testes de Hipóteses
Suponha que X é uma variável aleatória tempo
de duração de uma lâmpada de LED. Com base
em registros acredita-se que elas durem em
média aproximadamente 50.000 horas, com
desvio padrão de 15.0000 horas. De uma
população retiramos uma amostra de n
lâmpadas e a partir das observações verifica-se
que o tempo médio de reação não é exatamente
o observado. Podemos ter as seguintes
situações:
• H: 𝜇 ≠ 50.000 h;
• H: 𝜇 < 50.000 h;
• H: 𝜇 > 50.000 h;
Hipóteses!
Testes de Hipóteses
Hipótese: É uma afirmativa sobre uma
propriedade da população.
Teste de hipótese
• É um procedimento para se testar uma
afirmativa sobre uma propriedade da
população.
• Permite tomar decisões sobre a população
com base em informações de dados
amostrais.
Exemplo
• Em um restaurante, a média de clientes que
solicita comida vegana é superior a 30 anos?
• A proporção de peças defeituosas em um
lote é diferente do estabelecido pelo
fabricante?
Procedimentos para conduzir um
Teste de Hipóteses
• Definir a hipótese nula (H0) e a alternativa (Ha).
• Definir um nível de significância α, que irá determinar o nível de
confiança 100(1 − α)% do teste. Em geral 1%, 5% ou 10% de
significância.
• Definir o tipo de teste, com base na hipótese alternativa.
• Calcular a estatística de teste, com base na distribuição amostral do
estimador do parâmetro sob teste → valor calculado.
• Determinar a região crítica (região de rejeição), com base no nível de
significância α → valor crítico.
• Concluir o teste.
Tipos de Hipóteses
Hipótese Nula 𝑯𝟎
• É uma afirmativa de que o valor de
um parâmetro populacional é igual a
algum valor especificado.
• O termo nula é usado para indicar
nenhuma mudança ou nenhum
efeito.
Exemplos: µ = 10 p = 0.5
Hipótese Alternativa 𝑯𝒂
• É uma afirmativa de que o parâmetro
tem um valor que, de alguma forma,
difere da hipótese nula.
Exemplos: 𝜇 ≠ 10
𝑝 < 0,5
Decisões sobre a hipótese
Quando fazemos um teste de hipótese,
chegamos a um dos dois possíveis
resultados:
• Rejeitar 𝑯𝟎 em favor da hipótese
alternativa 𝐻𝑎.
• Não rejeitar 𝑯𝟎 e conclui-se que não
existem diferenças.
Tipos de Hipóteses
Exemplo O gerente de uma concessionária de
automóveis está pensando em um novo plano
de bonificações para aumentar o volume de
vendas. Atualmente, o volume médio de
vendas é de 14 automóveis por mês. O gerente
quer realizar uma pesquisa para verificar se o
novo plano de bonificações pode aumentar o
volume de vendas. Para coletar dados sobre o
plano, uma amostra da equipe de vendas será
autorizada a vender sob o novo plano de
bonificação durante o período de um mês.
a) Quais são as hipótese?
b) Comente a conclusão relativa a
quando H0 pode ser rejeitada.
𝐻0 ∶ 𝜇 = 14
𝐻𝑎: 𝜇 > 14
Solução: Existem evidências
amostrais de que o plano de
bonificações pode aumentar o
volume de vendas.
Solução: Supondo que 𝜇 seja a média da
variável aleatória de interesse, as hipóteses
são:
Tipos de Testes
A hipótese alternativa determinará o
sentido do teste de hipótese, que pode ser:
• Bilateral
Região de
Rejeição de 𝑯𝟎
1 − 𝛼
𝛼
Figura: A região de rejeição de 𝐻0 para uma
hipótese alternativa unilateral à esquerda.
𝐻0: 𝜃 = 𝜃0
𝐻𝑎: 𝜃 < 𝜃0
• Unilateral à Esquerda (Inferior)
𝐻0: 𝜃 = 𝜃0
𝐻𝑎: 𝜃 ≠ 𝜃0
Região de
Rejeição de 𝑯𝟎
Região de
Rejeição de 𝑯𝟎
Figura: A região de rejeição de 𝐻0 para uma
hipótese alternativa bilateral.
1 − 𝛼
𝛼
2
𝛼
2
Tipos de Testes
• Unilateral à Direita (Superior)
𝐻0: 𝜃 = 𝜃0
𝐻𝑎: 𝜃 > 𝜃0
Região de
Rejeição de 𝑯𝟎
𝛼
1 − 𝛼
Figura: A região de rejeição de 𝐻0 para uma
hipótese alternativa unilateral à direita.
Exemplo Em virtude do tempo e dos custos
elevados de produção e transformação, um
diretor de manufatura precisa convencer a
administração de que um novo método
proposto reduz os custos, antes de esse novo
método ser implementado. O método de
produção atual opera com um custo médio de
US$ 220 por hora. Um estudo medirá o custo
do novo método ao longo de um período de
produção amostral. Quais são as hipóteses
adequadas?
𝐻0 ∶ 𝜇 = 220
𝐻𝑎: 𝜇 < 220
Solução: Supondo que 𝜇 seja a média da
variável aleatória de interesse, as hipóteses
são:
Estatística do Teste
A estatística de teste é um valor usado para tomar a decisão sobre a hipótese
nula, supondo que ela seja verdadeira. Considera a distribuição amostral do
estimador sob a hipótese nula. As estatísticas para testes sobre a média e
proporção são apresentados a seguir.
Parâmetro
Média 𝝁
𝑧𝑐𝑎𝑙𝑐 =
𝑥 − 𝜇0
𝜎
√𝑛
𝑡𝑐𝑎𝑙𝑐 =
𝑥 − 𝜇0
𝑠
√𝑛
𝝈 conhecido
ou n> 30
Proporção (p)
𝑧𝑐𝑎𝑙𝑐 =
𝑝 − 𝑝0
𝑝0(1 − 𝑝0)
𝑛
Sim Não
Tomada de Decisão: Teste Bilateral
A decisão de rejeitar a hipótese nula ou não estará baseada na comparação das
estatísticas calculadas para cada teste com valores tabelados para distribuição
Normal padrão ou t-Student. Vejamos as condições a seguir.
Teste Bilateral: Duas regiões
críticas limitadas por valores
±𝑪𝜶
𝟐
. Se o teste for baseado na
distribuição Z, com 𝝈 conhecido
ou n>30, então os limites críticos
serão:
• ± 𝑧𝛼
2
= ± 1,645 se 𝛼 = 10%;
• ± 𝑧𝛼
2
= ± 1,96 se 𝛼 = 5%;
• ± 𝑧𝛼
2
= ±2,576 se 𝛼 = 1%;
−𝑧𝛼
2
𝑧𝛼
2
Rejeita 𝐻0
Rejeita 𝐻0
0
Decisão: Deve-se rejeitar 𝐻0 se
𝑧𝑐𝑎𝑙𝑐 < −𝑧𝛼
2
ou 𝑧𝑐𝑎𝑙𝑐 > 𝑧𝛼
2
.
Se o teste for baseado na t-Student,
substitui-se ±𝒛𝜶
𝟐
por valores ±𝒕𝜶
𝟐
;𝒏−𝟏 e a
decisão é análoga.
1 − 𝛼
𝛼
2
𝛼
2
Tomada de Decisão: Testes Unilaterais
Teste Unilateral: Duas regiões críticas limitadas por 𝑪𝜶 se o teste for unilateral à direita
(superior) e −𝑪𝜶 se o teste for unilateral à esquerda (inferior) . Se o teste for baseado na
distribuição Z, com 𝝈 conhecido ou n>30, então os limites críticos serão:
± 𝑧𝛼 = ± 2,33 se 𝛼 = 1%; ± 𝑧𝛼 = ± 1,645 se 𝛼 = 5%; ± 𝑧𝛼 = ± 1,28 se 𝛼 = 10%
−𝑧𝛼
Rejeita 𝐻0 se
𝑧𝑐𝑎𝑙𝑐 > 𝑧𝛼
0
Se o teste for baseado na t-Student, substitui-se
±𝒛𝜶 por valores ±𝒕𝜶;𝒏−𝟏 e a decisão é análoga.
1 − 𝛼
𝛼
𝑧𝛼
1 − 𝛼 𝛼
Rejeita 𝐻0 se
𝑧𝑐𝑎𝑙𝑐 < −𝑧𝛼
Unilateral
à Direita
Unilateral à
Esquerda
Testes de Hipóteses: Exemplo
Exemplo As declarações do imposto de renda
individuais entregues antes do dia 31 de maio obtiveram
uma restituição média de R$ 1.056. Considere a
população de declarantes de última hora que entregam
suas declarações durante os cinco últimos dias do
período de entrega das declarações do imposto de renda
(normalmente, de 26 a 31 de maio). Um pesquisador
sugere que uma razão para que as pessoas esperem até
os cinco últimos dias é que em média elas têm menores
restituições a receber do que aquelas que entregam as
declarações primeiro. Para uma amostra de 400
indivíduos que entregaram suas declarações entre 26 a
31 de maio a restituição média foi de R$ 910. Baseando-
se em experiências anteriores, pode-se supor um desvio
padrão populacional s = R$ 1.600. Teste a informação
com 5% de significância.
𝑯𝟎: 𝝁 = 𝟏𝟎𝟓𝟔
𝑯𝒂: 𝝁 < 𝟏𝟎𝟓𝟔
Solução: Temos um
teste unilateral a
esquerda. Logo as
hipóteses são:
𝑧𝑐𝑎𝑙𝑐 = (910 −1056)
1600
√400
= −1,825
Como −𝒛𝟓%= −𝟏, 𝟔𝟒𝟓 e 𝑧𝑐𝑎𝑙𝑐 < −𝒛𝟓%,
deve-se rejeitar 𝑯𝟎 ao nível de 5%.
Região de
rejeição de 𝐻0
𝑧𝑐𝑎𝑙𝑐 = -1,825
Testes de Hipóteses: Exemplo
Exemplo Foram coletados dados na Universidade
Tecnológica Federal do Paraná, em que buscou
constatar se a tensão fornecida pela rede corresponderia
ao previsto, ou seja, se a tensão à qual os equipamentos
eletrônicos estão sujeitos seria de 220 V ou 127 V.
Nesse caso, a análise se baseou em constatar a tensão
de 127 V em tomadas da Universidade. A análise de
dados ocorreu no bloco I, durante o período da tarde, do
dia 11 de novembro de 2015. Foram analisadas no total
15 tomadas, as quais compuseram a amostra a seguir:
125;124;125;125;125;125;124;123;
122;123;123;123;123;124;124. O objetivo foi constatar
se a tensão fornecida pela rede corresponderia ao
previsto, ou seja, se a tensão à qual os equipamentos
eletrônicos estão sujeitos seria de 220 V ou 127 V.
Nesse caso, a análise se baseou em constatar a tensão
de 127 V em tomadas da Universidade, com α = 5%
𝑯𝟎: 𝝁 = 𝟏𝟐𝟕 𝑽
𝑯𝒂: 𝝁 ≠ 𝟏𝟐𝟕 𝑽
Solução: Neste caso temos
um teste bilateral, com as
hipóteses:
𝑡𝑐𝑎𝑙𝑐 = (123,87 −127)
0,99
√15
= −12,25
Como −𝑡2,5%;14= ± 2,15 e 𝑡𝑐𝑎𝑙𝑐 <
−𝑡2,5%;14, deve-se rejeitar 𝐻0 ao nível de
5%.
Com base na amostra 𝑥 = 123,87 𝑉
𝑒 𝑠 = 0,99. Como n<30, usaremos
±𝒕𝜶
𝟐
;𝒏−𝟏.
Região de
rejeição de 𝐻0
𝑡𝑐𝑎𝑙𝑐 = -12,25
Testes de Hipóteses: Exemplo
Exemplo Uma empresa construtora de aviários,
utilizando seus empregados edificou 12 aviários
de certo padrão, gastando 45,8, 51,4 , 46,1, 50,9,
48,7, 53,2, 47,9, 50,1, 49,3, 52,6, 44,9, 54,4
horas por metro quadrado. Testar a hipótese de
ser diferente de 50 horas o tempo médio
necessário de mão-de-obra para a construção
daquele padrão de m², adotando um nível de
significância de 5%.
𝑯𝟎: 𝝁 = 𝟓𝟎 𝒉
𝑯𝒂: 𝝁 ≠ 𝟓𝟎 𝒉
Solução: Neste caso temos
um teste bilateral, com as
hipóteses:
𝑡𝑐𝑎𝑙𝑐 = (49,61 −50)
3,06
√12
= −0,44
Como −𝑡2,5%;11= ± 2,2009 e
−𝑡2,5%;11< 𝑡𝑐𝑎𝑙𝑐< 𝑡2,5%;11, não deve-se
rejeitar 𝐻0 ao nível de 5%.
Com base na amostra 𝑥 = 49,61 ℎ
𝑒 𝑠 = 3,06. Como n<30, usaremos
±𝒕𝜶
𝟐
;𝒏−𝟏.
Região de
rejeição de 𝐻0
𝑡𝑐𝑎𝑙𝑐 = -0,44
Testes de Hipóteses: Exemplo
Exemplo Sabe-se que por experiência que 5% da produção de um determinado artigo é
defeituosa. Um novo empregado é contratado. Ele produz 600 peças do artigo com 82
defeituosas. Ao nível de 15%, verificar se o novo empregado produz peças com maior
índice de defeitos que o existente.
𝑯𝟎: 𝒑 = 𝟎, 𝟎𝟓
𝑯𝒂: 𝒑 > 𝟎, 𝟎𝟓
Solução: Neste caso temos um teste unilateral a direita, com as hipóteses:
𝑍𝑐𝑎𝑙𝑐 = (0,137−0,05)
0,0089 = 9,77
Com base nas informações acima
𝑝 =
82
600
= 0,137
𝑒 𝜎𝑝 =
0,05 ∗(1−0,05)
600
= 0,0089
Como 𝑧15% = 1,03 e 𝑧𝑐𝑎𝑙𝑐 > 𝑧15%, deve-
se rejeitar 𝐻0 ao nível de 15%.
Testes de Hipóteses: p-valor
A decisão de rejeitar ou não a hipótese nula pode ser feita com base em dois conceitos.
O primeiro está relacionado com a probabilidade de obtermos um valor para média,
tão ou mais extrema que a média ou proporção da amostra observada, dado que a
hipótese nula é verdadeira, chamamos de p-valor ou valor p. A hipótese nula será
rejeitada caso p-valor seja inferior ao nível de significância dado por 𝛼. Etapas para
obter o p-valor
Observação: Se o teste basear-se na distribuição t-Student a área considerada é sob a
curva t com n-1 graus de liberdade.
Testes de Hipóteses: p-valor
Um fabricante de sprinklers, usados para proteção
contra incêndio em edifícios de escritórios, alega
que a temperatura média real de ativação do
sistema é 54 °C. Uma amostra de n = 9 sistemas,
quando testados, revela uma temperatura média
amostral de ativação de 54,57 °C. Se a
distribuição dos tempos de ativação fosse
normal com desvio padrão de 0,85 °C, os dados
contradiriam a alegação do fabricante com nível
de significância de 0,01?
Solução: Neste caso, temos um
teste bilateral, cujas hipóteses
são:
𝑯𝟎: 𝝁 = 54 °C
𝑯𝒂: 𝝁 ≠ 54 °C
𝑧𝑐𝑎𝑙𝑐 =
(54,57 − 54)
0,85
√9
= 2,012
p-valor= 2 × 1 − 𝜙 2,012 = 0,0444
Como o p-valor = 0,0444 > 0,01
H0 não pode ser rejeitada com
nível de significância 0,01.
0,005 0,005
0,0222
-2,012 2,012
0,0222
p-valor
Nível de Significância: Erros de Decisão
Para entendermos o que é o nível de significância (α), precisamos saber que, ao
realizar um teste de hipótese, estamos sujeitos a dois tipos de erros.
• Erro Tipo I: Rejeitar H0, quando H0 é verdadeira (falso negativo).
• Erro Tipo II: Não rejeitar H0, quando H0 é falsa (falso positivo).
α = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira).
β = P(erro tipo II) = P(não rejeitar H0 | H0 falsa)
Nível de Significância: Erros de Decisão
Figura: Erros de decisão em testes de hipótese
Fonte: http://www.leg.ufpr.br/~paulojus/estbas/slides/602_componentes_de_testes_de_hipoteses.pdf
Testes para comparação de duas Médias
Em várias situações científicas e práticas há
interesse em comparar o desempenho de dois ou
mais procedimentos (tratamentos), como por
exemplo:
• Dois processos de temperatura na produção de
materiais;
• Dois processos de treinamento aplicados a
funcionários;
• Velocidade de processamento de dois sistemas
operacionais.
Objetivo: Verificar se há evidência de
diferenças entre os efeitos dos
procedimentos.
• Teste t para amostras pareadas (Antes x
Depois);
• Teste t para amostras Independentes.
Tipos de Testes
Testes para comparação de duas Médias
Ao testar uma hipótese para duas populações, devem ser
consideradas
• Amostras dependentes ou emparelhadas: quando
cada elemento de uma amostra corresponde ao
mesmo elemento da outra amostra (geralmente o
mesmo indivíduo analisado antes e depois de um
experimento).
Exemplo: Teste para a diferença de peso de uma
mesma pessoa antes e depois de uma dieta.
• Amostras independentes: quando os valores
amostrados de uma população não estão
relacionados ou emparelhados com os da outra
população.
Exemplo: Teste para pressão sanguínea do grupo
controle versus grupo medicado.
Testes para comparação de duas Médias
Teste T Pareado
Em diferentes áreas do conhecimento, na grande maioria das vezes, são comparadas
amostras de dois dados, em que as variáveis respostas são mensuradas em dois momentos
distintos, antes e depois. Quando os dados possuem essa característica, dizemos que estes
são pareados.
𝐻0: 𝜇1 − 𝜇2 = 0
𝐻0: 𝜇𝐷 = 0
ou
D =𝑋1 – 𝑋2 é a diferença
entre a primeira e a segunda
observações dentro de um
par de observações.
Hipótese Nula Hipótese Alternativa
𝐻𝑎: 𝜇𝐷 ≠ 0
𝐻𝑎: 𝜇𝐷 > 0
𝐻𝑎: 𝜇𝐷 < 0
Bilateral
Unilateral à
Direita
Unilateral à
Esquerda
Estatística do Teste
𝑡𝑐𝑎𝑙𝑐 =
𝑑 − 𝜇𝐷
𝑠𝐷
√𝑛
• 𝑑 é a média da amostra das diferenças;
• 𝜇𝐷 é o valor das diferenças entre médias das populações a
ser testado;
• 𝑠𝐷desvio-padrão da amostra das diferenças;
• 𝑛 é o tamanho da amostra das diferenças.
Os valores para 𝒕𝜶;𝒏−𝟏 ou 𝒕𝜶/𝟐;𝒏−𝟏 seguem as mesmas
regras dos testes para uma amostra, assim como critérios
de rejeição de 𝑯𝟎.
Testes para comparação de duas Médias
Teste T Pareado
Exemplo Seja o problema de verificar se um
novo algoritmo de busca em um banco de dados
é mais rápido que o algoritmo atualmente
usado. Para fazer a comparação dos dois
algoritmos, planeja-se realizar uma amostra
aleatória de dez buscas experimentais. Em cada
realização, uma dada busca é realizada pelos
dois algoritmos e o tempo de resposta é
registrado para ambos os processos.
Considerando dez realizações, existe diferença
entre as velocidades de busca para os dois
algoritmos, ao nível de 5%?
Solução: As hipóteses são:
1 . 𝐻0: 𝜇𝐷 = 0
𝐻𝑎: 𝜇𝐷 ≠ 0
A1 A2 Diferença
22 25 -3
21 28 -7
28 26 2
30 36 -6
33 32 1
33 39 -6
26 28 -2
24 33 -9
31 30 1
22 27 -5
2 . A média das diferenças é 𝑑= -3,4 e o
Desvio-padrão das diferenças 𝑠𝐷 = 3,81.
3 . A estatística do teste será:
𝑡𝑐𝑎𝑙𝑐 =
−3,4 − 0
3,81
√10
= −2,82
4 . Como 𝑡2,5%;9 = ±2,2621 e
𝑡𝑐𝑎𝑙𝑐 < - 𝑡2,5%;9, rejeita-se 𝐻0 ao nível
de 5%.
Testes para comparação de duas Médias
Teste T para amostras Independentes
Quando em uma pesquisa o interesse é comparar o parâmetro de interesse para duas
populações independentes, deve-se usar o teste t para amostras independentes. Contudo,
deve-se considerar a homogeneidade (𝝈𝟏
𝟐
= 𝝈𝟐
𝟐
) ou heterogeneidade (𝝈𝟏
𝟐
≠ 𝝈𝟐
𝟐
) das
variâncias das populações. Aqui, assume-se 𝑠2 como estimativa de 𝜎2.
• Caso 1: (𝜎1
2
= 𝜎2
2
)
𝑡𝑐𝑎𝑙𝑐 =
𝑥1 − 𝑥2
𝑠𝑝
1
𝑛1
+
1
𝑛2
𝑣 = 𝑛1 + 𝑛2 − 2
𝑠𝑝 =
𝑛1 − 1 𝑠1
2
+ 𝑛2 − 1 𝑠2
2
𝑛1 + 𝑛2 − 2
• Caso 2: (𝜎1
2
≠ 𝜎2
2
)
𝑡𝑐𝑎𝑙𝑐 =
𝑥1 − 𝑥2
𝑠1
2
𝑛1
+
𝑠2
2
𝑛2
𝑣 =
𝑠1
2
𝑛1
+
𝑠2
2
𝑛2
2
𝑠1
2
𝑛1
2
𝑛1 − 1
+
𝑠2
2
𝑛2
2
𝑛2 − 1
Graus de liberdade
Estatística do Teste
Os valores para 𝒕𝜶;𝒏−𝟏 ou 𝒕𝜶/𝟐;𝒏−𝟏 seguem as mesmas
regras dos testes para uma amostra, assim como critérios
de rejeição de 𝑯𝟎.
Tamanho da amostra
Testes para comparação de duas Médias
Teste T para amostras Independentes
Exemplo Dois grupos de funcionários
foram submetidos a dois tipos de
treinamento. O primeiro grupo (A) de 5
pessoas alcançou um score de 80 pontos
com desvio-padrão de 5 pontos em uma
avaliação. Já o grupo B, formado por 6
pessoas obteve score de 83 pontos com
desvio-padrão de 4 pontos. Considerando
𝛼 = 5% , testar se as pontuações dos
funcionários são diferentes, sob a
suposição de que as variâncias admitidas
são iguais.
Solução: As hipóteses são:
𝐻0: 𝜇𝐴 − 𝜇𝐵 = 0
𝐻𝑎: 𝜇𝐴 − 𝜇𝐵 ≠ 0
𝑡𝑐𝑎𝑙𝑐 =
𝑥1 − 𝑥2
𝑠𝑝
1
𝑛1
+
1
𝑛2
=
80 − 83
4,47
1
5
+
1
6
= −1,12
𝑠𝑝 =
5 − 1 52 + 6 − 1 42
5 + 6 − 2
= 4,47
Para este caso v = 5+6-2 = 9, logo ±𝑡𝛼
2
;9=
± 2,2622.
𝑡𝑐𝑎𝑙𝑐 = −1,12
Portanto como − 2,2622 < 𝑡𝑐𝑎𝑙𝑐 < 2,2622
não rejeita-se 𝐻0 ao nível de 5% de
significância.
Testes para comparação de duas Médias
Teste T para amostras Independentes
Exemplo Suponha que 𝑚1 e 𝑚2 sejam
distâncias de parada médias reais em 50 mph
de certo tipo de carros equipados com dois
tipos diferentes de sistemas de frenagem.
Utilize o teste t para duas amostras no nível
de significância 0,01 para testar 𝐻0: 𝜇1 −
𝜇2 = 0 versus 𝐻𝑎 : 𝜇1 − 𝜇2 < 0para os
seguintes dados: 𝑛1= 𝑛2 = 6, 𝑥1 = 115,7, 𝑠1 =
5,03, 𝑥2 = 129,3 e 𝑠2 = 5,38. Suponha que as
variâncias são diferentes.
𝑡𝑐𝑎𝑙𝑐 =
115,7 − 129,3
5,032
6 +
5,382
6
= −2,61
Logo −𝑡1%;9= −2,8214.
𝑡𝑐𝑎𝑙𝑐 = −2,61
Portanto como − 2,8214 < −𝑡𝑐𝑎𝑙𝑐 não rejeita-
se 𝐻0 ao nível de 1% de significância.
Solução: A estatística do teste será:
𝑣 =
5,032
6+5,382
6
2
5,032
6
5
2
+
5,382
6
2
5
=9,96
Os graus de liberdade são dados por:
Fim!

Más contenido relacionado

Similar a Aula6-TestesdeHipoteses2 (1).pptx

12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressãoFernando Lucas
 
AMD - Aula n.º 1 - testes 1 amostra (1).pptx
AMD - Aula n.º 1 - testes 1 amostra (1).pptxAMD - Aula n.º 1 - testes 1 amostra (1).pptx
AMD - Aula n.º 1 - testes 1 amostra (1).pptxNunoSilva599593
 
5 intervalo de confiança
5   intervalo de confiança5   intervalo de confiança
5 intervalo de confiançaFernando Lucas
 
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxAMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxNunoSilva599593
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
AMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxAMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxNunoSilva599593
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Mgfamiliar Net
 
Monograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaMonograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaDionisio Ussaca
 
Aula 5 - Educação física
Aula 5 - Educação físicaAula 5 - Educação física
Aula 5 - Educação físicaCaroline Godoy
 
Testes hp
Testes hpTestes hp
Testes hpCarlos
 
Inferencia Estatistica ISG
Inferencia Estatistica ISGInferencia Estatistica ISG
Inferencia Estatistica ISGMargarida Nunes
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Kleverton Saath
 

Similar a Aula6-TestesdeHipoteses2 (1).pptx (20)

12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressão
 
AMD - Aula n.º 1 - testes 1 amostra (1).pptx
AMD - Aula n.º 1 - testes 1 amostra (1).pptxAMD - Aula n.º 1 - testes 1 amostra (1).pptx
AMD - Aula n.º 1 - testes 1 amostra (1).pptx
 
5 intervalo de confiança
5   intervalo de confiança5   intervalo de confiança
5 intervalo de confiança
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
Análise de dados com SciLab
Análise de dados com SciLabAnálise de dados com SciLab
Análise de dados com SciLab
 
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptxAMD - Aula n.º 3 - duas amostras emparelhadas.pptx
AMD - Aula n.º 3 - duas amostras emparelhadas.pptx
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
AMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptxAMD - Aula n.º 2 - testes amostras independentes.pptx
AMD - Aula n.º 2 - testes amostras independentes.pptx
 
Aula 13 teste de hipóteses
Aula 13   teste de hipótesesAula 13   teste de hipóteses
Aula 13 teste de hipóteses
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5
 
sld_1 (3).pdf
sld_1 (3).pdfsld_1 (3).pdf
sld_1 (3).pdf
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 
Modulo 4
Modulo 4Modulo 4
Modulo 4
 
Monograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaMonograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanha
 
Aula 01 p&e
Aula 01 p&eAula 01 p&e
Aula 01 p&e
 
Aula 5 - Educação física
Aula 5 - Educação físicaAula 5 - Educação física
Aula 5 - Educação física
 
Testes hp
Testes hpTestes hp
Testes hp
 
Inferencia Estatistica ISG
Inferencia Estatistica ISGInferencia Estatistica ISG
Inferencia Estatistica ISG
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Estatística intervalo de confiança (aula 4)
Estatística   intervalo de confiança (aula 4)Estatística   intervalo de confiança (aula 4)
Estatística intervalo de confiança (aula 4)
 

Aula6-TestesdeHipoteses2 (1).pptx

  • 1. Universidade Tecnológica Federal do Paraná Probabilidade e Estatística Inferência: Testes de Hipóteses e conceitos elementares Prof. Dr. Matheus Henrique Dal Molin Ribeiro Departamento de Matemática Câmpus Pato Branco
  • 2. População x Amostra População População: Conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados. Amostra: Subconjunto não vazio da População. Amostra Amostragem Inferência
  • 3. Inferência Estatística Inferência Estimação Testes de Hipóteses Etapa destinada a obter uma única estimativa (estimação pontual) ou um conjunto de estimativas (estimação intervalar) para um parâmetro. É um procedimento para se testar uma afirmativa sobre uma propriedade da população Generalizações sobre as características de uma população a partir da informação contida na amostra
  • 4. Testes de Hipóteses Suponha que X é uma variável aleatória tempo de duração de uma lâmpada de LED. Com base em registros acredita-se que elas durem em média aproximadamente 50.000 horas, com desvio padrão de 15.0000 horas. De uma população retiramos uma amostra de n lâmpadas e a partir das observações verifica-se que o tempo médio de reação não é exatamente o observado. Podemos ter as seguintes situações: • H: 𝜇 ≠ 50.000 h; • H: 𝜇 < 50.000 h; • H: 𝜇 > 50.000 h; Hipóteses!
  • 5. Testes de Hipóteses Hipótese: É uma afirmativa sobre uma propriedade da população. Teste de hipótese • É um procedimento para se testar uma afirmativa sobre uma propriedade da população. • Permite tomar decisões sobre a população com base em informações de dados amostrais. Exemplo • Em um restaurante, a média de clientes que solicita comida vegana é superior a 30 anos? • A proporção de peças defeituosas em um lote é diferente do estabelecido pelo fabricante?
  • 6. Procedimentos para conduzir um Teste de Hipóteses • Definir a hipótese nula (H0) e a alternativa (Ha). • Definir um nível de significância α, que irá determinar o nível de confiança 100(1 − α)% do teste. Em geral 1%, 5% ou 10% de significância. • Definir o tipo de teste, com base na hipótese alternativa. • Calcular a estatística de teste, com base na distribuição amostral do estimador do parâmetro sob teste → valor calculado. • Determinar a região crítica (região de rejeição), com base no nível de significância α → valor crítico. • Concluir o teste.
  • 7. Tipos de Hipóteses Hipótese Nula 𝑯𝟎 • É uma afirmativa de que o valor de um parâmetro populacional é igual a algum valor especificado. • O termo nula é usado para indicar nenhuma mudança ou nenhum efeito. Exemplos: µ = 10 p = 0.5 Hipótese Alternativa 𝑯𝒂 • É uma afirmativa de que o parâmetro tem um valor que, de alguma forma, difere da hipótese nula. Exemplos: 𝜇 ≠ 10 𝑝 < 0,5 Decisões sobre a hipótese Quando fazemos um teste de hipótese, chegamos a um dos dois possíveis resultados: • Rejeitar 𝑯𝟎 em favor da hipótese alternativa 𝐻𝑎. • Não rejeitar 𝑯𝟎 e conclui-se que não existem diferenças.
  • 8. Tipos de Hipóteses Exemplo O gerente de uma concessionária de automóveis está pensando em um novo plano de bonificações para aumentar o volume de vendas. Atualmente, o volume médio de vendas é de 14 automóveis por mês. O gerente quer realizar uma pesquisa para verificar se o novo plano de bonificações pode aumentar o volume de vendas. Para coletar dados sobre o plano, uma amostra da equipe de vendas será autorizada a vender sob o novo plano de bonificação durante o período de um mês. a) Quais são as hipótese? b) Comente a conclusão relativa a quando H0 pode ser rejeitada. 𝐻0 ∶ 𝜇 = 14 𝐻𝑎: 𝜇 > 14 Solução: Existem evidências amostrais de que o plano de bonificações pode aumentar o volume de vendas. Solução: Supondo que 𝜇 seja a média da variável aleatória de interesse, as hipóteses são:
  • 9. Tipos de Testes A hipótese alternativa determinará o sentido do teste de hipótese, que pode ser: • Bilateral Região de Rejeição de 𝑯𝟎 1 − 𝛼 𝛼 Figura: A região de rejeição de 𝐻0 para uma hipótese alternativa unilateral à esquerda. 𝐻0: 𝜃 = 𝜃0 𝐻𝑎: 𝜃 < 𝜃0 • Unilateral à Esquerda (Inferior) 𝐻0: 𝜃 = 𝜃0 𝐻𝑎: 𝜃 ≠ 𝜃0 Região de Rejeição de 𝑯𝟎 Região de Rejeição de 𝑯𝟎 Figura: A região de rejeição de 𝐻0 para uma hipótese alternativa bilateral. 1 − 𝛼 𝛼 2 𝛼 2
  • 10. Tipos de Testes • Unilateral à Direita (Superior) 𝐻0: 𝜃 = 𝜃0 𝐻𝑎: 𝜃 > 𝜃0 Região de Rejeição de 𝑯𝟎 𝛼 1 − 𝛼 Figura: A região de rejeição de 𝐻0 para uma hipótese alternativa unilateral à direita. Exemplo Em virtude do tempo e dos custos elevados de produção e transformação, um diretor de manufatura precisa convencer a administração de que um novo método proposto reduz os custos, antes de esse novo método ser implementado. O método de produção atual opera com um custo médio de US$ 220 por hora. Um estudo medirá o custo do novo método ao longo de um período de produção amostral. Quais são as hipóteses adequadas? 𝐻0 ∶ 𝜇 = 220 𝐻𝑎: 𝜇 < 220 Solução: Supondo que 𝜇 seja a média da variável aleatória de interesse, as hipóteses são:
  • 11. Estatística do Teste A estatística de teste é um valor usado para tomar a decisão sobre a hipótese nula, supondo que ela seja verdadeira. Considera a distribuição amostral do estimador sob a hipótese nula. As estatísticas para testes sobre a média e proporção são apresentados a seguir. Parâmetro Média 𝝁 𝑧𝑐𝑎𝑙𝑐 = 𝑥 − 𝜇0 𝜎 √𝑛 𝑡𝑐𝑎𝑙𝑐 = 𝑥 − 𝜇0 𝑠 √𝑛 𝝈 conhecido ou n> 30 Proporção (p) 𝑧𝑐𝑎𝑙𝑐 = 𝑝 − 𝑝0 𝑝0(1 − 𝑝0) 𝑛 Sim Não
  • 12. Tomada de Decisão: Teste Bilateral A decisão de rejeitar a hipótese nula ou não estará baseada na comparação das estatísticas calculadas para cada teste com valores tabelados para distribuição Normal padrão ou t-Student. Vejamos as condições a seguir. Teste Bilateral: Duas regiões críticas limitadas por valores ±𝑪𝜶 𝟐 . Se o teste for baseado na distribuição Z, com 𝝈 conhecido ou n>30, então os limites críticos serão: • ± 𝑧𝛼 2 = ± 1,645 se 𝛼 = 10%; • ± 𝑧𝛼 2 = ± 1,96 se 𝛼 = 5%; • ± 𝑧𝛼 2 = ±2,576 se 𝛼 = 1%; −𝑧𝛼 2 𝑧𝛼 2 Rejeita 𝐻0 Rejeita 𝐻0 0 Decisão: Deve-se rejeitar 𝐻0 se 𝑧𝑐𝑎𝑙𝑐 < −𝑧𝛼 2 ou 𝑧𝑐𝑎𝑙𝑐 > 𝑧𝛼 2 . Se o teste for baseado na t-Student, substitui-se ±𝒛𝜶 𝟐 por valores ±𝒕𝜶 𝟐 ;𝒏−𝟏 e a decisão é análoga. 1 − 𝛼 𝛼 2 𝛼 2
  • 13. Tomada de Decisão: Testes Unilaterais Teste Unilateral: Duas regiões críticas limitadas por 𝑪𝜶 se o teste for unilateral à direita (superior) e −𝑪𝜶 se o teste for unilateral à esquerda (inferior) . Se o teste for baseado na distribuição Z, com 𝝈 conhecido ou n>30, então os limites críticos serão: ± 𝑧𝛼 = ± 2,33 se 𝛼 = 1%; ± 𝑧𝛼 = ± 1,645 se 𝛼 = 5%; ± 𝑧𝛼 = ± 1,28 se 𝛼 = 10% −𝑧𝛼 Rejeita 𝐻0 se 𝑧𝑐𝑎𝑙𝑐 > 𝑧𝛼 0 Se o teste for baseado na t-Student, substitui-se ±𝒛𝜶 por valores ±𝒕𝜶;𝒏−𝟏 e a decisão é análoga. 1 − 𝛼 𝛼 𝑧𝛼 1 − 𝛼 𝛼 Rejeita 𝐻0 se 𝑧𝑐𝑎𝑙𝑐 < −𝑧𝛼 Unilateral à Direita Unilateral à Esquerda
  • 14. Testes de Hipóteses: Exemplo Exemplo As declarações do imposto de renda individuais entregues antes do dia 31 de maio obtiveram uma restituição média de R$ 1.056. Considere a população de declarantes de última hora que entregam suas declarações durante os cinco últimos dias do período de entrega das declarações do imposto de renda (normalmente, de 26 a 31 de maio). Um pesquisador sugere que uma razão para que as pessoas esperem até os cinco últimos dias é que em média elas têm menores restituições a receber do que aquelas que entregam as declarações primeiro. Para uma amostra de 400 indivíduos que entregaram suas declarações entre 26 a 31 de maio a restituição média foi de R$ 910. Baseando- se em experiências anteriores, pode-se supor um desvio padrão populacional s = R$ 1.600. Teste a informação com 5% de significância. 𝑯𝟎: 𝝁 = 𝟏𝟎𝟓𝟔 𝑯𝒂: 𝝁 < 𝟏𝟎𝟓𝟔 Solução: Temos um teste unilateral a esquerda. Logo as hipóteses são: 𝑧𝑐𝑎𝑙𝑐 = (910 −1056) 1600 √400 = −1,825 Como −𝒛𝟓%= −𝟏, 𝟔𝟒𝟓 e 𝑧𝑐𝑎𝑙𝑐 < −𝒛𝟓%, deve-se rejeitar 𝑯𝟎 ao nível de 5%. Região de rejeição de 𝐻0 𝑧𝑐𝑎𝑙𝑐 = -1,825
  • 15. Testes de Hipóteses: Exemplo Exemplo Foram coletados dados na Universidade Tecnológica Federal do Paraná, em que buscou constatar se a tensão fornecida pela rede corresponderia ao previsto, ou seja, se a tensão à qual os equipamentos eletrônicos estão sujeitos seria de 220 V ou 127 V. Nesse caso, a análise se baseou em constatar a tensão de 127 V em tomadas da Universidade. A análise de dados ocorreu no bloco I, durante o período da tarde, do dia 11 de novembro de 2015. Foram analisadas no total 15 tomadas, as quais compuseram a amostra a seguir: 125;124;125;125;125;125;124;123; 122;123;123;123;123;124;124. O objetivo foi constatar se a tensão fornecida pela rede corresponderia ao previsto, ou seja, se a tensão à qual os equipamentos eletrônicos estão sujeitos seria de 220 V ou 127 V. Nesse caso, a análise se baseou em constatar a tensão de 127 V em tomadas da Universidade, com α = 5% 𝑯𝟎: 𝝁 = 𝟏𝟐𝟕 𝑽 𝑯𝒂: 𝝁 ≠ 𝟏𝟐𝟕 𝑽 Solução: Neste caso temos um teste bilateral, com as hipóteses: 𝑡𝑐𝑎𝑙𝑐 = (123,87 −127) 0,99 √15 = −12,25 Como −𝑡2,5%;14= ± 2,15 e 𝑡𝑐𝑎𝑙𝑐 < −𝑡2,5%;14, deve-se rejeitar 𝐻0 ao nível de 5%. Com base na amostra 𝑥 = 123,87 𝑉 𝑒 𝑠 = 0,99. Como n<30, usaremos ±𝒕𝜶 𝟐 ;𝒏−𝟏. Região de rejeição de 𝐻0 𝑡𝑐𝑎𝑙𝑐 = -12,25
  • 16. Testes de Hipóteses: Exemplo Exemplo Uma empresa construtora de aviários, utilizando seus empregados edificou 12 aviários de certo padrão, gastando 45,8, 51,4 , 46,1, 50,9, 48,7, 53,2, 47,9, 50,1, 49,3, 52,6, 44,9, 54,4 horas por metro quadrado. Testar a hipótese de ser diferente de 50 horas o tempo médio necessário de mão-de-obra para a construção daquele padrão de m², adotando um nível de significância de 5%. 𝑯𝟎: 𝝁 = 𝟓𝟎 𝒉 𝑯𝒂: 𝝁 ≠ 𝟓𝟎 𝒉 Solução: Neste caso temos um teste bilateral, com as hipóteses: 𝑡𝑐𝑎𝑙𝑐 = (49,61 −50) 3,06 √12 = −0,44 Como −𝑡2,5%;11= ± 2,2009 e −𝑡2,5%;11< 𝑡𝑐𝑎𝑙𝑐< 𝑡2,5%;11, não deve-se rejeitar 𝐻0 ao nível de 5%. Com base na amostra 𝑥 = 49,61 ℎ 𝑒 𝑠 = 3,06. Como n<30, usaremos ±𝒕𝜶 𝟐 ;𝒏−𝟏. Região de rejeição de 𝐻0 𝑡𝑐𝑎𝑙𝑐 = -0,44
  • 17. Testes de Hipóteses: Exemplo Exemplo Sabe-se que por experiência que 5% da produção de um determinado artigo é defeituosa. Um novo empregado é contratado. Ele produz 600 peças do artigo com 82 defeituosas. Ao nível de 15%, verificar se o novo empregado produz peças com maior índice de defeitos que o existente. 𝑯𝟎: 𝒑 = 𝟎, 𝟎𝟓 𝑯𝒂: 𝒑 > 𝟎, 𝟎𝟓 Solução: Neste caso temos um teste unilateral a direita, com as hipóteses: 𝑍𝑐𝑎𝑙𝑐 = (0,137−0,05) 0,0089 = 9,77 Com base nas informações acima 𝑝 = 82 600 = 0,137 𝑒 𝜎𝑝 = 0,05 ∗(1−0,05) 600 = 0,0089 Como 𝑧15% = 1,03 e 𝑧𝑐𝑎𝑙𝑐 > 𝑧15%, deve- se rejeitar 𝐻0 ao nível de 15%.
  • 18. Testes de Hipóteses: p-valor A decisão de rejeitar ou não a hipótese nula pode ser feita com base em dois conceitos. O primeiro está relacionado com a probabilidade de obtermos um valor para média, tão ou mais extrema que a média ou proporção da amostra observada, dado que a hipótese nula é verdadeira, chamamos de p-valor ou valor p. A hipótese nula será rejeitada caso p-valor seja inferior ao nível de significância dado por 𝛼. Etapas para obter o p-valor Observação: Se o teste basear-se na distribuição t-Student a área considerada é sob a curva t com n-1 graus de liberdade.
  • 19. Testes de Hipóteses: p-valor Um fabricante de sprinklers, usados para proteção contra incêndio em edifícios de escritórios, alega que a temperatura média real de ativação do sistema é 54 °C. Uma amostra de n = 9 sistemas, quando testados, revela uma temperatura média amostral de ativação de 54,57 °C. Se a distribuição dos tempos de ativação fosse normal com desvio padrão de 0,85 °C, os dados contradiriam a alegação do fabricante com nível de significância de 0,01? Solução: Neste caso, temos um teste bilateral, cujas hipóteses são: 𝑯𝟎: 𝝁 = 54 °C 𝑯𝒂: 𝝁 ≠ 54 °C 𝑧𝑐𝑎𝑙𝑐 = (54,57 − 54) 0,85 √9 = 2,012 p-valor= 2 × 1 − 𝜙 2,012 = 0,0444 Como o p-valor = 0,0444 > 0,01 H0 não pode ser rejeitada com nível de significância 0,01. 0,005 0,005 0,0222 -2,012 2,012 0,0222 p-valor
  • 20. Nível de Significância: Erros de Decisão Para entendermos o que é o nível de significância (α), precisamos saber que, ao realizar um teste de hipótese, estamos sujeitos a dois tipos de erros. • Erro Tipo I: Rejeitar H0, quando H0 é verdadeira (falso negativo). • Erro Tipo II: Não rejeitar H0, quando H0 é falsa (falso positivo). α = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira). β = P(erro tipo II) = P(não rejeitar H0 | H0 falsa)
  • 21. Nível de Significância: Erros de Decisão Figura: Erros de decisão em testes de hipótese Fonte: http://www.leg.ufpr.br/~paulojus/estbas/slides/602_componentes_de_testes_de_hipoteses.pdf
  • 22. Testes para comparação de duas Médias Em várias situações científicas e práticas há interesse em comparar o desempenho de dois ou mais procedimentos (tratamentos), como por exemplo: • Dois processos de temperatura na produção de materiais; • Dois processos de treinamento aplicados a funcionários; • Velocidade de processamento de dois sistemas operacionais. Objetivo: Verificar se há evidência de diferenças entre os efeitos dos procedimentos. • Teste t para amostras pareadas (Antes x Depois); • Teste t para amostras Independentes. Tipos de Testes
  • 23. Testes para comparação de duas Médias Ao testar uma hipótese para duas populações, devem ser consideradas • Amostras dependentes ou emparelhadas: quando cada elemento de uma amostra corresponde ao mesmo elemento da outra amostra (geralmente o mesmo indivíduo analisado antes e depois de um experimento). Exemplo: Teste para a diferença de peso de uma mesma pessoa antes e depois de uma dieta. • Amostras independentes: quando os valores amostrados de uma população não estão relacionados ou emparelhados com os da outra população. Exemplo: Teste para pressão sanguínea do grupo controle versus grupo medicado.
  • 24. Testes para comparação de duas Médias Teste T Pareado Em diferentes áreas do conhecimento, na grande maioria das vezes, são comparadas amostras de dois dados, em que as variáveis respostas são mensuradas em dois momentos distintos, antes e depois. Quando os dados possuem essa característica, dizemos que estes são pareados. 𝐻0: 𝜇1 − 𝜇2 = 0 𝐻0: 𝜇𝐷 = 0 ou D =𝑋1 – 𝑋2 é a diferença entre a primeira e a segunda observações dentro de um par de observações. Hipótese Nula Hipótese Alternativa 𝐻𝑎: 𝜇𝐷 ≠ 0 𝐻𝑎: 𝜇𝐷 > 0 𝐻𝑎: 𝜇𝐷 < 0 Bilateral Unilateral à Direita Unilateral à Esquerda Estatística do Teste 𝑡𝑐𝑎𝑙𝑐 = 𝑑 − 𝜇𝐷 𝑠𝐷 √𝑛 • 𝑑 é a média da amostra das diferenças; • 𝜇𝐷 é o valor das diferenças entre médias das populações a ser testado; • 𝑠𝐷desvio-padrão da amostra das diferenças; • 𝑛 é o tamanho da amostra das diferenças. Os valores para 𝒕𝜶;𝒏−𝟏 ou 𝒕𝜶/𝟐;𝒏−𝟏 seguem as mesmas regras dos testes para uma amostra, assim como critérios de rejeição de 𝑯𝟎.
  • 25. Testes para comparação de duas Médias Teste T Pareado Exemplo Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de dez buscas experimentais. Em cada realização, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta é registrado para ambos os processos. Considerando dez realizações, existe diferença entre as velocidades de busca para os dois algoritmos, ao nível de 5%? Solução: As hipóteses são: 1 . 𝐻0: 𝜇𝐷 = 0 𝐻𝑎: 𝜇𝐷 ≠ 0 A1 A2 Diferença 22 25 -3 21 28 -7 28 26 2 30 36 -6 33 32 1 33 39 -6 26 28 -2 24 33 -9 31 30 1 22 27 -5 2 . A média das diferenças é 𝑑= -3,4 e o Desvio-padrão das diferenças 𝑠𝐷 = 3,81. 3 . A estatística do teste será: 𝑡𝑐𝑎𝑙𝑐 = −3,4 − 0 3,81 √10 = −2,82 4 . Como 𝑡2,5%;9 = ±2,2621 e 𝑡𝑐𝑎𝑙𝑐 < - 𝑡2,5%;9, rejeita-se 𝐻0 ao nível de 5%.
  • 26. Testes para comparação de duas Médias Teste T para amostras Independentes Quando em uma pesquisa o interesse é comparar o parâmetro de interesse para duas populações independentes, deve-se usar o teste t para amostras independentes. Contudo, deve-se considerar a homogeneidade (𝝈𝟏 𝟐 = 𝝈𝟐 𝟐 ) ou heterogeneidade (𝝈𝟏 𝟐 ≠ 𝝈𝟐 𝟐 ) das variâncias das populações. Aqui, assume-se 𝑠2 como estimativa de 𝜎2. • Caso 1: (𝜎1 2 = 𝜎2 2 ) 𝑡𝑐𝑎𝑙𝑐 = 𝑥1 − 𝑥2 𝑠𝑝 1 𝑛1 + 1 𝑛2 𝑣 = 𝑛1 + 𝑛2 − 2 𝑠𝑝 = 𝑛1 − 1 𝑠1 2 + 𝑛2 − 1 𝑠2 2 𝑛1 + 𝑛2 − 2 • Caso 2: (𝜎1 2 ≠ 𝜎2 2 ) 𝑡𝑐𝑎𝑙𝑐 = 𝑥1 − 𝑥2 𝑠1 2 𝑛1 + 𝑠2 2 𝑛2 𝑣 = 𝑠1 2 𝑛1 + 𝑠2 2 𝑛2 2 𝑠1 2 𝑛1 2 𝑛1 − 1 + 𝑠2 2 𝑛2 2 𝑛2 − 1 Graus de liberdade Estatística do Teste Os valores para 𝒕𝜶;𝒏−𝟏 ou 𝒕𝜶/𝟐;𝒏−𝟏 seguem as mesmas regras dos testes para uma amostra, assim como critérios de rejeição de 𝑯𝟎. Tamanho da amostra
  • 27. Testes para comparação de duas Médias Teste T para amostras Independentes Exemplo Dois grupos de funcionários foram submetidos a dois tipos de treinamento. O primeiro grupo (A) de 5 pessoas alcançou um score de 80 pontos com desvio-padrão de 5 pontos em uma avaliação. Já o grupo B, formado por 6 pessoas obteve score de 83 pontos com desvio-padrão de 4 pontos. Considerando 𝛼 = 5% , testar se as pontuações dos funcionários são diferentes, sob a suposição de que as variâncias admitidas são iguais. Solução: As hipóteses são: 𝐻0: 𝜇𝐴 − 𝜇𝐵 = 0 𝐻𝑎: 𝜇𝐴 − 𝜇𝐵 ≠ 0 𝑡𝑐𝑎𝑙𝑐 = 𝑥1 − 𝑥2 𝑠𝑝 1 𝑛1 + 1 𝑛2 = 80 − 83 4,47 1 5 + 1 6 = −1,12 𝑠𝑝 = 5 − 1 52 + 6 − 1 42 5 + 6 − 2 = 4,47 Para este caso v = 5+6-2 = 9, logo ±𝑡𝛼 2 ;9= ± 2,2622. 𝑡𝑐𝑎𝑙𝑐 = −1,12 Portanto como − 2,2622 < 𝑡𝑐𝑎𝑙𝑐 < 2,2622 não rejeita-se 𝐻0 ao nível de 5% de significância.
  • 28. Testes para comparação de duas Médias Teste T para amostras Independentes Exemplo Suponha que 𝑚1 e 𝑚2 sejam distâncias de parada médias reais em 50 mph de certo tipo de carros equipados com dois tipos diferentes de sistemas de frenagem. Utilize o teste t para duas amostras no nível de significância 0,01 para testar 𝐻0: 𝜇1 − 𝜇2 = 0 versus 𝐻𝑎 : 𝜇1 − 𝜇2 < 0para os seguintes dados: 𝑛1= 𝑛2 = 6, 𝑥1 = 115,7, 𝑠1 = 5,03, 𝑥2 = 129,3 e 𝑠2 = 5,38. Suponha que as variâncias são diferentes. 𝑡𝑐𝑎𝑙𝑐 = 115,7 − 129,3 5,032 6 + 5,382 6 = −2,61 Logo −𝑡1%;9= −2,8214. 𝑡𝑐𝑎𝑙𝑐 = −2,61 Portanto como − 2,8214 < −𝑡𝑐𝑎𝑙𝑐 não rejeita- se 𝐻0 ao nível de 1% de significância. Solução: A estatística do teste será: 𝑣 = 5,032 6+5,382 6 2 5,032 6 5 2 + 5,382 6 2 5 =9,96 Os graus de liberdade são dados por:
  • 29. Fim!