O documento discute o acidente do ônibus espacial Challenger em 1986, que matou sete astronautas. O acidente foi causado pelo rompimento de anéis de vedação (O-rings) devido à temperatura baixa no lançamento, que não foi considerada nos testes de falha. O documento então apresenta um modelo de regressão linear simples para prever o número de O-rings que falharão baseado na temperatura, encontrando uma forte correlação negativa entre as variáveis.
Imitando a Mãe Dináh: Adivinhando o futuro com modelos de regressão usando R
1. Imitando a Mãe Dináh: Adivinhando
o futuro com modelos de regressão
usando R
2. ● O acidente matou toda a
tripulação de sete astronautas
● Falha causada pelo
rompimento dos O-rings
(juntas tóricas). O ônibus
espacial tinha seis desses
anéis
● O-rings não suportaram a
temperatura aproximada de -
2ºC do momento do
lançamento
● Testes de falha nos O-rings
tinham sido realizados com
temperaturas entre 10ºC e
26ºC
● À partir do rompimentos de
três O-rings, a chance de
vazamento de combustível
aumenta drasticamente
Challenger - 29/02/1986
5. O modelo
Onde y denota o valor a ser previsto (variável
dependente), β o coeficiente angular da matriz X e α o
coeficiente linear (interseção ou valor quando xi = 0)
y = α + βX
6. Calculando α e β
Mínimos quadrados ordinários (OLS) estimam os
valores ótimos tentando minimizar a soma dos erros
quadrados (SSE) ou residuais.
SSE = Σ(yi-ŷi)2 ~ Σei
2
7. Estimando α e β
α β Temperature
2.425 -0.102
Para cada O-ring que falha, a temperatura cai
aproximadamente 10%, segundo β.
No final, α define o valor da variável dependente caso
todas as independentes sejam zero (o valor em y
quando x = 0).
9. ➔ Forças
◆ É o modelo mais simples
e utilizado para
modelagem numérica
◆ Aplicações em estatística,
psicologia, genética,
meteorologia, entre outros
◆ A maioria dos tipos de
dados pode ser adaptada
e utilizada
➔ Fraquezas
◆ Assume distribuição
normal (gaussiana) da
variável dependente
◆ Dados devem ser
obrigatoriamente
numéricos (necessita
conversão)
◆ Exige linearidade e alta
correlação
10. Correlação de Pearson
σ = desvio-padrão
Para as variáveis Distressed O-rings e Temperature,
temos um ρ = -0.725671. Ou seja, uma forte correlação
negativa (quando x diminui, y aumenta)