O documento discute conceitos de causalidade e abdução na pesquisa científica. Apresenta definições de causalidade e explica porque é importante identificar relações causais para explicar fenômenos e prever efeitos de ações. Também discute desafios em identificar causalidade em sistemas projetados e como correlação não é suficiente para inferir causalidade, sendo necessário controlar potenciais causas comuns.
Gerência de Armazenamento: Implementação do Sistema de Arquivos
Causalidade e Abdução
1. Metodologia
da
Pesquisa
Cien1fica
Aula
06:
Causalidade
e
Abdução
Professor:
Alexandre
Duarte
Web:
h5p://alexandre.ci.ufpb.br/ensino/mpc
2. CAUSALIDADE
“The
paradigma,c
asser,on
in
causal
rela,onships
is
that
manipula,on
of
a
cause
will
result
in
the
manipula,on
of
an
effect...
Causa>on
implies
that
by
varying
one
factor,
I
can
make
another
vary.”
-‐
Cook
&
Campbell
(1979).
3. Por
que
nos
preocupamos
com
causalidade?
• Explicação
– Uma
associação
nos
permite
prever
mas
não
explicar
um
fenômeno
– A
iden>ficação
dos
mecanismos
de
causalidade
nos
permite
produzir
explicações
mais
sa>sfatórias
• Controle
– Entender
a
causalidade
nos
permite
prever
os
efeitos
de
determinadas
ações
sem
que
elas
precisem
ser
executadas
– Isso
possibilita
uma
exploração
mais
eficiente
do
espaço
amostral
4. Development
of
Western
science
is
based
on
two
great
achievements:
the
inven>on
of
the
formal
logical
system
(in
Euclidean
geometry)
by
the
Greek
philosophers,
and
the
discovery
of
the
possibility
to
find
out
causal
rela>onships
by
systema>c
experiment
(during
the
Renaissance).
Albert
Einstein
(1953)
5. Não
seria
trivial
iden>ficar
causalidade
em
sistema
projetos
por
nós
?
• Tarefa/Ambiente:
Nós
não
projetamos
vários
dos
aspectos
responsáveis
pelo
comportamento
• Complexidade:
Nós
nem
sempre
entendemos
as
causas
para
determinados
comportamentos
• Spandrels:
Limitações
do
projeto
muitas
vezes
criam
funcionalidades
acidentais,
muitas
das
quais
podem
parecer
ser
(ou
efe>vamente
ser)
causais.
“As
computer
scien>sts,
we
design
our
systems,
and
we
leave
out
extraneous
components.
Isn’t
everything
causal?”
8. Spandrels
em
Ciência
da
Computação
• Várias
das
caracterís>cas
de
um
sistema
são..
– Inteiramente
acidentais
(“Tínhamos
que
escolher
uma
ou
outra”)
– Resultado
de
limitações
de
projeto
(“O
compilador
do
Z354
não
conseguia
lidar
com
os
dados
então
>vemos
que
fazer
...”)
– Selecionadas
de
acordo
com
a
crença
contemporânea
(“Foi
então
que
concluímos
que
roteamento
dinâmica
não
era,
de
fato,
pra>cável”)
• ...
e
muitas
outras
decisões
de
projeto
são
influenciadas
por
tais
caracterís>cas
...
• ...
fazendo
com
que
elas
acabem
parecendo
ser
essenciais
ao
longo
do
tempo.
14. Por
que
correlação
pode
ser
cruel?
• Variação
da
causa
potencial
(Quantas
alterna>vas
foram
examinadas?)
• Força
do
efeito
(O
que
um
“quase”
significa?)
• Tamanho
da
amostra
(Dois
algoritmos
ou
vinte?)
• Independência
(Todos
os
algoritmos
são
derivados
de
uma
fonte
em
comum?)
15. Por
que
correlação
não
é
suficiente?
• Correlação
com
a
causa
esperada
(“Fumar
causa
câncer”)
• Correlação
com
o
inverso
da
causa
esperada
(“Câncer
leva
as
pessoas
a
fumarem”)
• Correlação
com
uma
causa
oculta
(“Um
gene
leva
as
pessoas
a
fumarem
e
a
terem
câncer”)
A
B
A
B
A
B
C
16. Eliminando
causas
comuns
• Controle:
mantenha
potencias
causas
comuns
constantes
de
forma
que
elas
não
possam
afetar
o
resultado
(Bacon,
1620)
• Randomização:
Varia
de
forma
aleatória
os
níveis
de
potenciais
causas
comuns
de
forma
que
elas
não
possam
afetar
sistema>camente
o
resultado
(Fisher,
1925)
• Modelagem:
Meça,
modele
e
remova
matema>camente
o
os
efeitos
de
potenciais
causas
comuns
(Rubin
1974;
Spirtes,
Glymour
&
Scheines
1993;
Pearl
2000)
17. Eliminando
causas
comuns:
Controle
• Selecione
explicitamente
os
níveis
(valores)
para
todas
as
outras
potenciais
causas
de
forma
que
apenas
as
causas
inves>gadas
possam
exercer
efeito
no
resultado
• Exemplo
– Todos
os
par>cipantes
do
nosso
estudo
eram
alunos
do
1º
semestre
– No
começo
de
cada
execução
a
base
de
conhecimento
estava
vazia
– Cada
protocolo
foi
executado
em
cada
uma
das
K
redes
geradas
aleatoriamente
• O
que
pode
dar
errado?
– Causas
desconhecidas
– Falha
no
controle
– Confounding
18. Eliminando
causas
comuns:
Randomização
• Tenta>va
de
garan>r
que
o
efeito
de
outras
potenciais
causas
é
desprezível
– Atribui
valores
a
variáveis
independentes
sem
qualquer
razão
– Permite
eliminar
causas
desconhecidas
• Exemplos:
– Distribuímos
aleatoriamente
os
dados
entre
o
grupo
de
treino
e
de
teste
– As
requisições
foram
tratadas
tanto
pelo
protocolo
an>go
quanto
pelo
novo
de
acordo
com
um
gerador
de
números
pseudoaleatórios
• O
que
pode
dar
errado?
– Distribuição
não-‐aleatória
– Confounding
19. Eliminando
causas
comuns:
Modelagem
• Ajustar
explicitamente
o
valor
do
efeito
para
descartar
os
efeitos
de
outras
potenciais
causas
• Exemplo
– Nós
incluímos
todas
as
potenciais
causas
conhecidas
além
de
x
em
nosso
modelo
de
regressão
linear
e
os
efeitos
de
x
con>nuam
a
ser
esta>s>camente
significa>vos
• O
que
pode
dar
errado?
– Fatores
causais
desconhecidos
– Erros
no
modelo
– Bias
na
escolha
dos
parâmetros
do
modelo
20. ABDUÇÃO
“...a
method
of
reasoning
in
which
one
chooses
the
hypothesis
that
would,
if
true,
best
explain
the
relevant
evidence.
Abduc>ve
reasoning
starts
from
a
set
of
accepted
facts
and
infers
their
most
likely,
or
best,
explana>ons.”
21. Formas
de
raciocínio
cienxfico
• Dedu>vo
– Dedução
lógica
• Indu>vo
– Inferência
indu>va
• Abdu>vo
– Inferência
abdu>va
22. Raciocínio
Dedu>vo
• Uma
dedução
é
uma
espécie
de
argumento
no
qual
a
forma
lógica
válida
garante
a
verdade
da
conclusão
dada
a
veracidade
das
premissas
– Premissa
1:
Todos
os
homens
são
mortais.
– Premissa
2:
Sócrates
é
um
homem.
– Conclusão:
Sócrates
é
mortal.
23. Raciocínio
Indu>vo
• Infere
uma
conclusão
a
par>r
de
múl>plas
observações
de
fatos
• Observações
– O
ferro
conduz
eletricidade
– O
ferro
é
metal
– O
ouro
conduz
eletricidade
– O
ouro
é
metal
– O
cobre
conduz
eletricidade
– O
cobre
é
metal
• Inferência
indu>va
– Os
metais
conduzem
eletricidade.
24. Raciocínio
Abdu>vo
• A
abdução
é
a
inferência
a
favor
da
melhor
explicação.
– A
hipótese
de
A
ser
verdadeira
explica
B.
– Nenhuma
outra
hipótese
pode
explicar
B
tão
bem
quanto
A.
– Logo
A
é
provavelmente
verdadeira
25. Raciocínio
abdu>vo
na
ciência
• A
abdução
seleciona,
entre
as
hipóteses
consideradas,
aquela
que
melhor
explica
as
evidências
• O
raciocínio
abdu>vo
é
fortemente
relacionado
ao
método
estaxs>co
da
máxima
verossimilhança
• Existe
várias
ameaças
óbvias
à
sua
validade
– Número
insuficiente
de
hipóteses
– Quan>dade
insuficiente
de
evidências
• Ambos
são
aspectos
chave
na
prá>ca
cienxfica
26. Teorias
que
julgamos
serem
verdadeiras
Teorias
que
são
efe>vamente
verdadeiras
Teorias
que
achamos
que
foram
testadas
corretamente
Teorias
que
já
foram
cogitadas
27. Desafios
da
abdução
• Definir
um
conjunto
de
hipóteses
com
grande
probabilidade
de
conter
a
hipótese
“verdadeira”
– Abordagem:
criar
o
maior
conjunto
possível
• Descobrir
que
há
hipóteses
válidos
fora
do
seu
conjunto
de
hipóteses
– Abordagem:
Avaliar
constantemente
seu
conjunto
de
hipóteses
o
expandido
sempre
que
os
dados
se
tornem
inexplicáveis
dada
qualquer
uma
das
hipóteses
consideradas
até
o
momento
• Criar
um
bom
conjunto
e
evidências
para
explicar
– Abordagem:
Busque
fontes
diversas
e
independente
de
evidências
com
as
quais
você
possa
avaliar
suas
hipóteses