MyEdu Club: il magazine di MyEdu dedicato ai genitori
Genetica di Popolazioni 1
1. Genetica di popolazioni
Guido Barbujani
Dip. Scienze della Vita e Biotecnologie
Università di Ferrara
g.barbujani@unife.it
2. Obiettivi del corso:
Capire le basi genetiche dell’evoluzione
Arrivare a porsi domande
scientificamente corrette
Arrivare a poter leggere criticamente un
articolo
POWERPOINT: http://utenti.unife.it/guido.barbujani/index.php?lng=it&p=5
ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html
4. Frankham, Ballou, Briscoe.
Fondamenti di Genetica della
conservazione, Zanichelli
Conner & Hartl. Elementi di
Genetica ecologica, Piccin
Hartl & Clark. Principles of
poplation genetics. Sinauer
5. ALCUNE DOMANDE IMPORTANTI
• Con che frequenza troviamo unioni consanguinee nelle popolazioni, e quali effetti hanno?
• Cosa ci dice la diversità genetica riguardo alla storia delle diverse specie?
• Come possiamo utilizzare dati genetici per ricostruire la storia delle migrazioni?
• Perché alcune popolazioni presentano frequenze elevate di alleli patologici?
• Perché alcune piccole popolazioni sono così diverse da quelle vicine?
6. Cose da ricordare, per cominciare
1.
2.
3.
4.
5.
Cos’è un gene, un allele, un aplotipo
Com’è fatto il DNA
Com’è fatto un gene Eucariote
Com’è fatto un gene procariote
Com’è la struttura dei geni (siti codificanti, siti di
regolazione, introni, esoni)
6. Come funzionano i geni
7. Cosa si intende per locus genico?
Cosa si intende per allele?
Cosa vuol dire che due geni sono indipendenti?
Se le coppie A,a e B,b sono indipendenti che gameti
produce il genotipo AaBb? E il genotipo Aa BB?
Cosa vuol dire che due geni sono associati?
Se le coppie A,a e B,b sono associate che gameti produce il
genotipo AaBb e il genotipo Aa BB?
Se AaBb si incrocia con AaBb che tipi di figli può avere?
Se AaBb si incrocia con aabb che tipi di figli può avere?
8. Qual è la differenza tra meiosi e mitosi?
Che cos’è il crossing-over?
Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono
evidenziabili nei gameti?
Cosa significa dire che i gameti sono aploidi?
In che modo i geni codificano le proteine?
Che differenza c’è tra popolazione e specie?
Quanti alleli di un dato locus ci sono in una popolazione?
Specie diverse con lo stesso numero di cromosomi si possono
incrociare?
9. Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
10. Programma del corso
1. Diversità genetica
2. Equilibrio di Hardy-Weinberg
3. Inbreeding
4. Linkage disequilibrium
5. Mutazione
6. Deriva genetica
7. Flusso genico e varianze genetiche
8. Selezione
9. Mantenimento dei polimorfismi e teoria neutrale
10. Introduzione alla teoria coalescente
11. Struttura e storia della popolazione umana
+ Lettura critica di articoli
12. Prima di tutto: non c’è genetica
senza variabilità
Variabilità morfologica
13. 1.
2.
3.
4.
Variabilità morfologica
Variabilità serologica
Variabilità proteica
Variabilità del DNA
4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP)
4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of
Tandem Repeats (VNTR), Short Tandem Repeats (STR)
4.3. Varianti strutturali: Copy-Number Variation (CNV)
14. Quanto DNA in una cellula?
5-20 μ
Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi
1 base ≈ 0,8 mμ
6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
15. Quanto DNA in una cellula?
6 miliardi di paia di basi
1 base ≈ 0,8 mμ
6 miliardi di basi ≈ 5 m di DNA in 5-20 μ
Foglio A4, 60 battute per riga. 30 righe = 1800 basi
su ogni foglio, due facciate ≈ 2000 basi
Se 100 fogli = 1 cm
6 miliardi di paia di basi ≈ 15000 cm = 150 m
16. J.B.S. Haldane: Frequenza dell’allele AB0*B in Europa
Variabilità genetica: Proteine, Test serologici
21. Some human genome statistics
Total size
3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011]
N of protein-coding genes
21 224 [were 20 442]
N of RNA genes
15 952
N of pseudogenes
14 427
N of gene exons
679 045
N of gene transcripts
194 015
N of short variants
52 126 039 (+ 13.4 million: Lachance et al. 2012)
N of structural variants
6 303 392
From Ensembl Release 68, July 2012
Nucleotide differences with chimp
Structural differences with chimp
Human genes missing in chimp
1.5 %
4%
60 (expressed mainly in cerebral cortex and testes)
From Wu et al. (2011) PLoS Genet
23. I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il
10% del genoma
Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra
parte contiene importanti siti di regolazione
25. Tipi di polimorfismo studiati nel DNA
1.
2.
3.
4.
Single Nucleotide Polymorphism: SNP
Inserzione/delezione
Variazione del numero di copie: Indel, STR, VNTR,
Variazione strutturale: CNV
26. Tipi di polimorfismo studiati nel DNA
1. SNP
2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)
2012: Almeno 65 milioni di SNPs nel genoma umano (Lachance et al. 2012)
31. Tipi di polimorfismo studiati nel DNA
1. SNP: Effetti fenotipici
Cioè in regioni: regolatrici codificanti
Con sostituzioni:
nonsinonime
intergeniche
sinonime
introniche
41. Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: CNV
An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH.
Blue lines: individuals with two copies. Red line: individual with zero copies.
42. Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: CNV
La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di
geni.
Competizione per il legame su cromosomi in metafase di due DNA genomici marcati
con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è
un pool di DNA genomico di riferimento.
Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel
locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se
ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al
numero di copie presenti nel DNA genomico di controllo.
43. 3. Variazione del numero di copie: CNV
Marques-Bonet et al. (2009) Trends in Genetics 25:443-454
44.
45. Average mutation rates for different polymorphisms
(per locus per generation)
VNTR
10-1 – 10-2
STR
10-2 – 10-4
SNPs
10-6 – 10-8
Indel (retrovirus) 10-10 – 10-11
CNV
?
In the mitochondrial DNA hypervariable region, up to 5 x 10 -5 per site per
generation
47. Misure di diversità genetica
•
•
N di alleli
Eterozigosi osservata:
Ho = N genotipi eteroz./N genotipi totali
•
Eterozigosi attesa:
H = 1 –Σ pi2
(la frazione di individui che ci si aspetta siano eterozigoti a un
gene sconosciuto)
48. Quand’è che una popolazione può dirsi
variabile?
A
N alleli = 5
HO = 0.4
H = 0.35
B
N alleli = 2
HO = 0.6
H = 0.5
Quando il genotipo individuale è difficile da prevedere
49. Quand’è che una popolazione può dirsi
variabile?
•
Quando molti siti del DNA sono variabili
diversità nucleotidica:
π = N siti polimorfici / N totale siti
• Quando ci sono grandi differenze molecolari fra I suoi membri
mismatch medio:
k = Σ dij / [N (N-1) / 2]
50. Il mismatch è il numero di sostituzioni fra
coppie di individui
TCTAGA
1
CCTAGA
1
2
1
2
2
CCTAGG
2
2
CTTAGA
CTTAAA
Σ dij = 17
1
k = 1.7
3
51.
52.
53.
54.
55. Un’applicazione: variabilità STR in popolazioni di lupi
scandinavi (Flagstad et al. 2003)
N alleli
HO
H
1829-1889
5.0
0.66
0.74
1890-1939
4.4
0.61
0.68
1940-1980
3.1
0.45
0.52
Finlandia
4.9
0.69
0.72
57. Livelli di
diversità fra
uomo e
scimpanzè
Tempi di
dissociazione
indicano una
differenza pari
all’1.76%
(Sibley & Ahlquist,
1984)
58. Livelli di polimorfismo nell’uomo: SNP
Kaessmann et al. (2001)
35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi
di basi (genoma aploide) 1.23% (Chimpanzee Genome
Sequencing Consortium, 2005)
Di questi SNP, 1.06% fissati fra specie
0.17% polimorfici nell’uomo
59. Livelli di polimorfismo nell’uomo: Indel
Marquès-Bonet et al. (2009)
Origine della
duplicazione
Siti di
inserzione
60. Livelli di polimorfismo nell’uomo: genomi
completi
Nel 2010 erano 14 i genomi
interamente sequenziati (6
miliardi di paia di basi)
61. Nel 2010 erano 14 i genomi interamente
sequenziati (6 miliardi di paia di basi)
Africa del sud
Americani bianchi
Yoruba
Asiatici
Polimorfici almeno lo 0.13% dei siti
62. Nel 2014 i genomi umani interamente
sequenziati sono migliaia
Population
African Caribbean in Barbados [ACB]
Number of
Individual DNA Samples
79
African Ancestry in SW USA [ASW]
62
British From England and Scotland [GBR]
100
Chinese Dai in Xishuangbanna, China [CDX]
100
Colombian in Medellín, Colombia [CLM]
105
Finnish in Finland [FIN]
100
Han Chinese in Beijing, China [CHB]
Han Chinese South [CHS]
Iberian Populations in Spain [IBS]
Japanese in Tokyo, Japan [JPT]
120
150
150
120
Kinh in Ho Chi Minh City, Vietnam [KHV]
100
Luhya in Webuye, Kenya [LWK]
Mexican Ancestry in Los Angeles [MXL]
Peruvian in Lima Peru [PEL]
Puerto Rican in Puerto Rico [PUR]
Toscani in Italia [TSI]
Yoruba in Ibadan, Nigeria [YRI]
120
71
105
105
114
62
64. Le stime genomiche di FST per la
popolazione umana globale sono ∼ 0.12
N of
markers
599,356
SNPs
1,034,741
SNPs
1,007,329
SNPs
443,434
SNPs
2,841,354
SNPs
243,855
SNPs
100 Alu
insertions
67 CNVs
Samples
209 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
71 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
269 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
3845 worldwide distributed individuals
FST
Reference
0.13
Weir et al. 2005
0.10
Weir et al. 2005
0.12
0.052
International HapMap
Consortium 2005
Auton et al. 2009
210 individuals from 4 populations: Caucasian,
Chinese, Japanese, Yoruba
554 individuals from 27 worldwide populations
0.11
Barreiro et al. 2008
0.123
Xing et al. 2009
710 individuals from 23 worldwide populations
0.095
Watkins et al. 2008
270 individuals from 4 populations with
ancestry in Europe, Africa or Asia
0.11
Redon et al. 2006
Le popolazioni umane esprimono ∼ 12% della varianza massima
possibile, date le loro frequenze alleliche
66. Due persone dello
stesso continente
possono essere
geneticamente più
distanti di persone di
continenti diversi.
67. In media, ci sono differenze più grandi fra due
africani che fra europei e asiatici
In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of
nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an
average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010)
68. Nota bene
La variabilità interna di una popolazione è solo uno degli
aspetti della variabilità genetica:
Variabilità tra individui della stessa popolazione
Variabilità tra individui di popolazioni diverse
Variabilità tra individui di gruppi di popolazioni diverse
eccetera
69. PS: Cos’è una popolazione?
Hendrick: un gruppo di individui che si accoppiano e
coesistono nel tempo e nello spazio
In pratica, si usano come unità operative di analisi gruppi di
individui localizzati nello spazio, che spesso hanno in
comune vari tratti culturali, come mezzi di sussistenza,
lingua, casta (in India), religione.
La scelta dell’unità operativa di analisi dipende spesso (a) dalla
domanda scientifica che ci si pone e (b) dalla effettiva
disponibilità di dati
70. Riassunto
• La genetica di popolazioni è un ramo della genetica, e quindi si
occupa di studiare la variabilità
• Si può descrivere la variabilità o diversità genetica a partire dal
fenotipo (morfologia o proteina) o dal genotipo (DNA)
• La diversità del DNA è dovuta a polimorfismi di singolo nucleotide
(SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza
di delezioni, inserzioni o duplicazioni (CNV)
• Per quantificare la diversità genetica si ricorre a statistiche, fra cui: (1)
numero di alleli; (2) eterozigosi osservata; (3) eterozigosi attesa; (4)
polimorfismo nucleotidico; (5) differenze a coppie o mismatch