Más contenido relacionado Ku 05 08 20091. Open problems in
association mapping
Thomas Mailund
&
!"
Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
Research
2. Stuff about
Open problems in
association mapping
Thomas Mailund
&
!"
Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
Research
5. Gunshot wounds
Car accidents
Smoking induced
lung cancer “Genetic” diseases
Cardiovascular
disease
Obesity
Diabetes 2
Alzheimer
Schizophrenia
BRCA1
breast cancer
Cystic fibrosis
Haemophilia
6. Disease mapping...
Locate disease-affecting polymorphisms
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
7. Disease mapping...
Locate phenotype-affecting polymorphisms
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
8. Disease mapping...
Markers are locally correlated
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
9. Marker Relatedness
Linkage disequilibrium (LD)
Empirical Results Theoretical Results
LD (r2)
Recombination rate
Clark et al. 2003, AJHG 73:285-300. Hein et al. 2005
10. Disease mapping...
Search for indirect signals
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
11. Indirect Association
“Tag” markers Unobserved marker
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
12. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
13. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
14. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
15. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
26. GWA a successful
approach
~500 validated findings
for ~100 different traits
...but much genetic risk
remains unexplained!
28. Why?
• Rare variants?
• We only tag common variants...
• Gene-gene interaction?
• Marginal effects vs interactions...
30. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
31. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
32. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
33. Indirect Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
34. Indirect
Multi-Marker
Association
Cases (affected)
--A--------C--------A----G---X----T---C---A----
--T--------G--------A----G---X----C---C---A----
--A--------G--------G----G---X----C---C---A----
--A--------C--------A----G---X----T---C---A----
--T--------C--------A----G---X----T---C---A----
--T--------C--------A----T---X----T---A---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------A----G---X----T---C---G----
--T--------C--------A----T---X----T---C---A----
--A--------C--------A----G---X----T---C---A----
--A--------C--------G----T---X----C---A---A----
--A--------C--------A----G---X----C---C---G----
Controls (unaffected)
41. Clustering on a tree
Complete penetrance
Incomplete penetrance
Spurious disease
42. Clustering on a tree
25%
Case/control clustering
is not random on the tree...
75%
40%
60%
43. Scoring the clustering
Red=cases
Green=controls
Are the case chromosomes significantly
over-represented in some clusters?
49. A
A
A
G
G
A 3 2
A
A G 3 2
A
G
G
3
1.5
0
A G
50. T
T
A
A
A
T 2 3
A
A A 2 3
A
T
T
3
1.5
0
T A
51. A T
A T
A A AT 2 0
G A
G A
AA 1 1
GA 2 0
A A
A A
A A GT 0 2
G T
G T
2
1
0
AT AA GA GT
59. • Using protein interaction networks we
• Reduced ~125 billion tests to ~3-4 million
• Reduced corrected significance threshold
-8
from ~4·10-13 to ~9·10
62. Perspectives...
• Complete genome sequencing
• No need for tagging
• Rare variants
• Structural variation
• Pathway analysis
• Analysis of pathways as a whole
• Constructing tests from known pathways