1
UNIVERSIDAD AUTÓNOMA DE YUCATÁN
Campus Ciencias de la Salud
Facultad de Química
Lic. En Químico Farmacéutico Biólogo
FARMACOGENÉTICA Y FARMACOGENÓMICA
ADA3: Secuenciación masiva
Equipo: 4
Alumnos
Br. Cool Méndez Carlos Alberto
Br. Encalada Salazar Rai
Br. Jiménez Becerra Daniel Eduardo
Mérida, Yucatán23 de Junio 2017
La secuenciación del ADN consiste en determinar el orden de las
bases A, C, G y T en un fragmento de ADN.
ATCGATCGATCGATCAGCTACGATCG
ATCGATCGATCGATCGATCAGCATCG
ATCGATCGATCGATCGATCGATCGAT
CGATCGATCGATCGATCGATCGATCG
ATCGATCGATCATTTATATTCTGCCGT
ACGACCTGACTGATCTGATCGAGTCG
ATCGACTACATATCGATCGATCGACG
ATCGTACGTATGCATGCGATCGTATCG
AGTCGTACTACGAGTCGACTGATCGT
AGTATATATGCAGCGATCGATGATCG
AGTCGATGTATTCTGACGCGATCTGA
GTCTGATGCCGTAGCAACGCTATGCT
ACTAGCTGACGTCATGCGTACGTAGT
CGTAGTACGTATCGATGCTGATGCAC
2
Las bases de la
secuenciación de ADN
Principales tecnologías
de Secuenciación
Aplicaciones de la
secuenciación de ADN
3
El impacto de las tecnologías de secuenciación masiva
4
Allan M. Maxam y Walter Gilbert establecieron el proceso de
digestión química del DNA para determinar la secuencia de
nucleótidos del ADN.
3´
3´
5´
5´
3´
5´
5´
3´
Isótopo radioactivo (32P)
A y G Dimetil sulfato (DMS)
C y T Hidracina y Piperidina
Metilan
5
Trata
Lectura de unas 100
bases de secuencias
Técnica de baja
resolución y en desuso
6
Método de terminación de cadena o método Sanger (Frederick
Sanger)
Se basa en hacer cuatro reacciones diferentes de síntesis de ADN
utilizando la función propia de la ADN polimerasa y utilizando un
didesoxinucleótido (ddNTP)
ddNTP
no tiene un
grupo hidroxilo
en el 3´
Un dNTP
marcado con
32P
7
Lectura de unas 300-500
nucleótidos
8
Una técnica mucho más eficiente en tiempo,
ejecución y sensibilidad de los resultados que
la de digestión enzimática
Conformado por equipos que emplean distintos métodos para la secuenciación con
un esquema de trabajo similar.
Tienen en común en que los amplicones de PCR derivados de cualquier molécula de
biblioteca única terminan agrupados espacialmente, ya sea en una única ubicación
en un sustrato plano o en la superficie de perlas de escala micrométrica.
Ventajas Desventajas
Construcción de librería y amplificación
in vitro sin el empleo de
microorganismos.
Longitudes de lectura más cortas que
en la secuenciación convencional.
Precisión en bruto diez veces menor al
convencional.
La secuenciación basada en matriz tiene
un grado mucho más alto de
paralelismo en la lectura que la
secuenciación convencional.
La inmovilización en una superficie
permite manipular enzimáticamente
con un único volumen de reactivo (Uso
de pL o fL).
Muestra
ADN, ARN
Librería
Fragmentación
Ligación adaptadores
Librería Muestra
Single o paired-end
Secuenciación
Equipo Illumina,
Roche…
Reads NGS crudos
Formato fastQ o CS-FastQ
Informe experimento
Pasan/Fallan
Tasas error
Alineamiento
BWA, BFAST, Bowtie…
Secuencia de
referencia
Informe alineamiento
Reads y bases
alineados
Fichero BAM
Unir, ordenar y marcar
reads duplicados
Informeduplicados
Tasas duplicados y
únicos
Indexación fichero BAM
Reads alineados, no alineados
y duplicados
11
fichero BAM
Indexado y con duplicados
marcados
Alineados
Distancia/orientación
correctas
Aberrantes
Distancia/orientación
inesperadas
No alineados
No alineados a la secuencia
referencia
SNPs y pequeñas
indels
Cambios de
número de copia
Detección de
VE/indels grandes
Variantes
estructurales
Nuevas
inserciones
Identificación
12
13
Preparación del template
Secuenciación e imágenes
Terminación reversible cíclica
(CRT)
Adición de un solo nucléotido
(SNA) o pirosecuenciación
Secuenciación por ligación
(SBL)
ADN polimerasa
ADN polimerasa
ADN ligasa
Template amplificados
clonalmente
• Emulsión PCR
• Amplificación en fase
sólida (PCR Puente)
Templates de una sola
molécula
• Primer inmovilizado
• Template inmovilizado
Pirosecuenciación
14
Primer inmovilizado
Emulsión PCR
15
Preparación de la muestra
Extracción del ADN
Purificación del ADN
Fragmentación del ADN
La fragmentación se lleva a cabo mediante el proceso de tagmentación:
1. Combinación del transposoma con adaptador parcial y el ADN.
2. Fragmentación y adición del adaptador parcial por el transposoma.
3. PCR de ciclo limitado para añadir cebadores e indexes.
16
Generación de clusters: Amplificación en fase sólida
D
F
U
o
e
n
s
r
m
n
i
ó
a
a
n
t
c
u
c
i
r
ó
o
a
n
v
l
i
a
z
d
l
a
e
e
c
n
i
c
ó
t
l
e
u
n
s
d
c
t
e
o
e
r
n
s
f
d
o
c
e
r
e
m
b
c
a
d
m
e
o
i
n
r
d
e
a
s
s
d
d
e
e
i
n
r
l
e
c
a
i
c
l
d
l
t
a
o
o
c
b
e
o
l
e
n
i
n
v
e
e
r
s
x
o
t
r
s
c
e
a
e
m
d
n
o
e
e
s
n
l
a
l
s
i
b
o
r
p
e
o
s
r
t
e
FDesna
ormación
turalde
izaci
l
aón
cad
cena
on
formamida
compleme
de
nlt
a
aria
doble
cadena
A
D
S
m
e
e
n
p
c
s
l
o
i
d
f
l
i
o
a
c
c
d
a
a
c
d
n
i
ó
e
l
n
o
a
s
d
m
e
t
e
p
l
m
l
A
i
f
D
p
i
c
N
l
a
a
c
t
c
i
e
ó
o
s
n
dP
e
q
C
p
u
R
e
e
n
p
c
d
u
o
ie
n
n
tt
i
te
d
c
e
o
e
n
n
ll
a
ad
y
ru
ed
n
ga
i
só
id
na
ed
d
e
s
c
o
e
b
n
d
a
o
d
e
c
i
o
d
c
r
e
a
e
b
s
y
a
i
a
d
n
d
o
m
a
r
ó
e
p
s
v
t
a
i
l
d
e
o
sres
17
Secuenciación: Terminación reversible cíclica
7. Continuación en Paso 3
1. Hibridación de cebador a secuencia universal del
tamplate
2. Adición de los 4 nucléotidos con marcadores
fluorescentes de diferente color.
3. Incorporación de nucleótidos por la polimerasa.
4. Lavado y obtención de imagen de colores según el
nucleótido ensamblado
5. Eliminación del marcador fluorescente de los
nucleótidos incorporados (regenera 3’-OH) con TCEP*
6. Lavado y adición de los 4 nucleótidos modificados
*TCEP: tris (2-carboxietil) fosfina (agente reductor)
19
Tratamiento de datos
Alineamiento
o
ensamblado
Análisis de
los
resultados
De novo Resecuenciación
Características
Costo por Megabase: 2 dólares
Costo de equipo: 430,000 – 540,000 dólares
Longitud de lectura: 36 – 100 pb
Tiempo de corrida: 4 – 9 días
Tasa de error: 1 – 1.5% hasta <0.1%
Ventajas
• Plataforma más empleada actualmente
• Requiere de poca muestra (aprox. 1 ng)
• Bajo costo de secuenciación
• Numerosas aplicaciones
• Pocos requisitos de infraestructura
Desventajas
• Lento
• Multiplexación (combinación de señales)
• Capacidad de muestras
• Equipo costoso
• Laborioso
• Personal capacitado
• Mutaciones durante la amplificación
• Reducida eficiencia en la secuenciación dirigida a
regiones de interés
• Longitudes de lectura limitadas por factores que
causan la desintegración de señal y el desfasado
22
23
24
25
26
27
• La detección por citometría de secuenciación de ADN rápida basada en
la detección de moléculas simples: se basa en la detección de los fotones
emitidos por moléculas simples en un flujo laminar a su paso a través de
un haz concentrado de rayos laser. El espectro de emisión de los cuatro
marcadores fluorescentes, permite identificar a las cuatro bases.
• Lectura directa de secuencia de bases en la cadena de ADN mediante
microscopios de túnel de barrido.
• Análisis de la secuencia de ADN mediante espectrometría de masas.
• La secuenciación por hibridación sobre paneles de oligonucleótidos de
secuencia conocida
Secuenciación de moléculas de ADN individuales
nucleótido a nucleótido (Tecnología en desarrollo)
• El primer secuenciador de tercera generación lo
vende Helicos BioSciences
• Permite generar de forma fiable fragmentos de
entre 25 y 45 bases.
• Dada la pequeñez de las lecturas generadas, esta
resecuenciación de genomas y no
tecnología está recomendada para la
para la
secuenciación de novo.
30
Equipo Compañía Método de
secuenciación
DNA
molde
Longitud
lecturas (pb)
Tiemp
o
carrera
Nt/carrera
(Gb)
Helicos
tSMS
Helicos
BioSciences
Polimerasa Molécula
única
25-45 192 37
Pacific
Bioscien
ces
Pacific
Biosciences
Polimerasa Molécula
única
1000 NA NA
ZX
Genetics
ZX Genetics Microscopia
electrónica
Molécula
única
NA NA NA
Mide el efecto a nivel iónico y eléctrico del
paso de una hebra de ADN a través de un
nanoporo
32
• Secuenciación individualizada
• Secuenciación de forma directa
• Lectura ultralarga (lectura de la longitud total)
• Económico
• Rápido
Desventajas
Oxford Nanopore´s MinION
• Requiere gran cantidad de ADN
• Necesita secuenciar muchas moléculas únicas para
un consenso aceptable
Ventajas
• Rodríguez, J. Secuenciación de genomas. Arbor. 2004, 698, 287-289.
• Maxam, A.; Gilbert, A. A new method for sequencing DNA. PNAS, 1977, 74, 2, 560-
564.
• Rodríguez, B.; Armengol, L. Tecnologías de secuenciación de nueva generación en
diagnóstico genético pre- y postnatal. Diagn. Prenat. 2012, 23, 2, 56 – 66.
• Shendure, J.; Ji, Hanlee. Next-generation DNA sequencing. Nature biotechnology.
2008, 26, 10, 1135 – 1145.
• Metzker, M. Sequencing technologies – the next generation. Nature Reviews. 2010,
11, 31 – 46.
33
• Technical Support Note: Sequencing. Illumina.
https://support.illumina.com/content/dam/illumina-
support/documents/documentation/chemistry_documentation/samplepreps_nexter
a/nextera-xt/nextera-xt-troubleshooting-guide.pdf (consultado junio 2017).
• Applied Biological Materials. https://www.abmgood.com (consultado junio 2017).
• Genética Médica Blog. http://revistageneticamedica.com/blog/secuenciacion-
tercera-generacion/ (consultado junio 2017).
• Romero, C. Genética Humana, 1 ed.; Bilvao: España, 1995; 47-49.
• Bautista, R. Las tres generaciones de la secuenciación. Universidad de Málaga. 2010,
3, 128

SECUENCIAS MASIVAS.pptx

  • 1.
    1 UNIVERSIDAD AUTÓNOMA DEYUCATÁN Campus Ciencias de la Salud Facultad de Química Lic. En Químico Farmacéutico Biólogo FARMACOGENÉTICA Y FARMACOGENÓMICA ADA3: Secuenciación masiva Equipo: 4 Alumnos Br. Cool Méndez Carlos Alberto Br. Encalada Salazar Rai Br. Jiménez Becerra Daniel Eduardo Mérida, Yucatán23 de Junio 2017
  • 2.
    La secuenciación delADN consiste en determinar el orden de las bases A, C, G y T en un fragmento de ADN. ATCGATCGATCGATCAGCTACGATCG ATCGATCGATCGATCGATCAGCATCG ATCGATCGATCGATCGATCGATCGAT CGATCGATCGATCGATCGATCGATCG ATCGATCGATCATTTATATTCTGCCGT ACGACCTGACTGATCTGATCGAGTCG ATCGACTACATATCGATCGATCGACG ATCGTACGTATGCATGCGATCGTATCG AGTCGTACTACGAGTCGACTGATCGT AGTATATATGCAGCGATCGATGATCG AGTCGATGTATTCTGACGCGATCTGA GTCTGATGCCGTAGCAACGCTATGCT ACTAGCTGACGTCATGCGTACGTAGT CGTAGTACGTATCGATGCTGATGCAC 2
  • 3.
    Las bases dela secuenciación de ADN Principales tecnologías de Secuenciación Aplicaciones de la secuenciación de ADN 3
  • 4.
    El impacto delas tecnologías de secuenciación masiva 4
  • 5.
    Allan M. Maxamy Walter Gilbert establecieron el proceso de digestión química del DNA para determinar la secuencia de nucleótidos del ADN. 3´ 3´ 5´ 5´ 3´ 5´ 5´ 3´ Isótopo radioactivo (32P) A y G Dimetil sulfato (DMS) C y T Hidracina y Piperidina Metilan 5 Trata
  • 6.
    Lectura de unas100 bases de secuencias Técnica de baja resolución y en desuso 6
  • 7.
    Método de terminaciónde cadena o método Sanger (Frederick Sanger) Se basa en hacer cuatro reacciones diferentes de síntesis de ADN utilizando la función propia de la ADN polimerasa y utilizando un didesoxinucleótido (ddNTP) ddNTP no tiene un grupo hidroxilo en el 3´ Un dNTP marcado con 32P 7
  • 8.
    Lectura de unas300-500 nucleótidos 8 Una técnica mucho más eficiente en tiempo, ejecución y sensibilidad de los resultados que la de digestión enzimática
  • 10.
    Conformado por equiposque emplean distintos métodos para la secuenciación con un esquema de trabajo similar. Tienen en común en que los amplicones de PCR derivados de cualquier molécula de biblioteca única terminan agrupados espacialmente, ya sea en una única ubicación en un sustrato plano o en la superficie de perlas de escala micrométrica. Ventajas Desventajas Construcción de librería y amplificación in vitro sin el empleo de microorganismos. Longitudes de lectura más cortas que en la secuenciación convencional. Precisión en bruto diez veces menor al convencional. La secuenciación basada en matriz tiene un grado mucho más alto de paralelismo en la lectura que la secuenciación convencional. La inmovilización en una superficie permite manipular enzimáticamente con un único volumen de reactivo (Uso de pL o fL).
  • 11.
    Muestra ADN, ARN Librería Fragmentación Ligación adaptadores LibreríaMuestra Single o paired-end Secuenciación Equipo Illumina, Roche… Reads NGS crudos Formato fastQ o CS-FastQ Informe experimento Pasan/Fallan Tasas error Alineamiento BWA, BFAST, Bowtie… Secuencia de referencia Informe alineamiento Reads y bases alineados Fichero BAM Unir, ordenar y marcar reads duplicados Informeduplicados Tasas duplicados y únicos Indexación fichero BAM Reads alineados, no alineados y duplicados 11
  • 12.
    fichero BAM Indexado ycon duplicados marcados Alineados Distancia/orientación correctas Aberrantes Distancia/orientación inesperadas No alineados No alineados a la secuencia referencia SNPs y pequeñas indels Cambios de número de copia Detección de VE/indels grandes Variantes estructurales Nuevas inserciones Identificación 12
  • 13.
    13 Preparación del template Secuenciacióne imágenes Terminación reversible cíclica (CRT) Adición de un solo nucléotido (SNA) o pirosecuenciación Secuenciación por ligación (SBL) ADN polimerasa ADN polimerasa ADN ligasa Template amplificados clonalmente • Emulsión PCR • Amplificación en fase sólida (PCR Puente) Templates de una sola molécula • Primer inmovilizado • Template inmovilizado
  • 14.
  • 15.
    15 Preparación de lamuestra Extracción del ADN Purificación del ADN Fragmentación del ADN La fragmentación se lleva a cabo mediante el proceso de tagmentación: 1. Combinación del transposoma con adaptador parcial y el ADN. 2. Fragmentación y adición del adaptador parcial por el transposoma. 3. PCR de ciclo limitado para añadir cebadores e indexes.
  • 16.
    16 Generación de clusters:Amplificación en fase sólida D F U o e n s r m n i ó a a n t c u c i r ó o a n v l i a z d l a e e c n i c ó t l e u n s d c t e o e r n s f d o c e r e m b c a d m e o i n r d e a s s d d e e i n r l e c a i c l d l t a o o c b e o l e n i n v e e r s x o t r s c e a e m d n o e e s n l a l s i b o r p e o s r t e FDesna ormación turalde izaci l aón cad cena on formamida compleme de nlt a aria doble cadena A D S m e e n p c s l o i d f l i o a c c d a a c d n i ó e l n o a s d m e t e p l m l A i f D p i c N l a a c t c i e ó o s n dP e q C p u R e e n p c d u o ie n n tt i te d c e o e n n ll a ad y ru ed n ga i só id na ed d e s c o e b n d a o d e c i o d c r e a e b s y a i a d n d o m a r ó e p s v t a i l d e o sres
  • 17.
    17 Secuenciación: Terminación reversiblecíclica 7. Continuación en Paso 3 1. Hibridación de cebador a secuencia universal del tamplate 2. Adición de los 4 nucléotidos con marcadores fluorescentes de diferente color. 3. Incorporación de nucleótidos por la polimerasa. 4. Lavado y obtención de imagen de colores según el nucleótido ensamblado 5. Eliminación del marcador fluorescente de los nucleótidos incorporados (regenera 3’-OH) con TCEP* 6. Lavado y adición de los 4 nucleótidos modificados *TCEP: tris (2-carboxietil) fosfina (agente reductor)
  • 19.
    19 Tratamiento de datos Alineamiento o ensamblado Análisisde los resultados De novo Resecuenciación
  • 20.
    Características Costo por Megabase:2 dólares Costo de equipo: 430,000 – 540,000 dólares Longitud de lectura: 36 – 100 pb Tiempo de corrida: 4 – 9 días Tasa de error: 1 – 1.5% hasta <0.1%
  • 21.
    Ventajas • Plataforma másempleada actualmente • Requiere de poca muestra (aprox. 1 ng) • Bajo costo de secuenciación • Numerosas aplicaciones • Pocos requisitos de infraestructura Desventajas • Lento • Multiplexación (combinación de señales) • Capacidad de muestras • Equipo costoso • Laborioso • Personal capacitado • Mutaciones durante la amplificación • Reducida eficiencia en la secuenciación dirigida a regiones de interés • Longitudes de lectura limitadas por factores que causan la desintegración de señal y el desfasado
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
    • La detecciónpor citometría de secuenciación de ADN rápida basada en la detección de moléculas simples: se basa en la detección de los fotones emitidos por moléculas simples en un flujo laminar a su paso a través de un haz concentrado de rayos laser. El espectro de emisión de los cuatro marcadores fluorescentes, permite identificar a las cuatro bases. • Lectura directa de secuencia de bases en la cadena de ADN mediante microscopios de túnel de barrido. • Análisis de la secuencia de ADN mediante espectrometría de masas. • La secuenciación por hibridación sobre paneles de oligonucleótidos de secuencia conocida
  • 29.
    Secuenciación de moléculasde ADN individuales nucleótido a nucleótido (Tecnología en desarrollo)
  • 30.
    • El primersecuenciador de tercera generación lo vende Helicos BioSciences • Permite generar de forma fiable fragmentos de entre 25 y 45 bases. • Dada la pequeñez de las lecturas generadas, esta resecuenciación de genomas y no tecnología está recomendada para la para la secuenciación de novo. 30
  • 31.
    Equipo Compañía Métodode secuenciación DNA molde Longitud lecturas (pb) Tiemp o carrera Nt/carrera (Gb) Helicos tSMS Helicos BioSciences Polimerasa Molécula única 25-45 192 37 Pacific Bioscien ces Pacific Biosciences Polimerasa Molécula única 1000 NA NA ZX Genetics ZX Genetics Microscopia electrónica Molécula única NA NA NA
  • 32.
    Mide el efectoa nivel iónico y eléctrico del paso de una hebra de ADN a través de un nanoporo 32 • Secuenciación individualizada • Secuenciación de forma directa • Lectura ultralarga (lectura de la longitud total) • Económico • Rápido Desventajas Oxford Nanopore´s MinION • Requiere gran cantidad de ADN • Necesita secuenciar muchas moléculas únicas para un consenso aceptable Ventajas
  • 33.
    • Rodríguez, J.Secuenciación de genomas. Arbor. 2004, 698, 287-289. • Maxam, A.; Gilbert, A. A new method for sequencing DNA. PNAS, 1977, 74, 2, 560- 564. • Rodríguez, B.; Armengol, L. Tecnologías de secuenciación de nueva generación en diagnóstico genético pre- y postnatal. Diagn. Prenat. 2012, 23, 2, 56 – 66. • Shendure, J.; Ji, Hanlee. Next-generation DNA sequencing. Nature biotechnology. 2008, 26, 10, 1135 – 1145. • Metzker, M. Sequencing technologies – the next generation. Nature Reviews. 2010, 11, 31 – 46. 33 • Technical Support Note: Sequencing. Illumina. https://support.illumina.com/content/dam/illumina- support/documents/documentation/chemistry_documentation/samplepreps_nexter a/nextera-xt/nextera-xt-troubleshooting-guide.pdf (consultado junio 2017). • Applied Biological Materials. https://www.abmgood.com (consultado junio 2017). • Genética Médica Blog. http://revistageneticamedica.com/blog/secuenciacion- tercera-generacion/ (consultado junio 2017). • Romero, C. Genética Humana, 1 ed.; Bilvao: España, 1995; 47-49. • Bautista, R. Las tres generaciones de la secuenciación. Universidad de Málaga. 2010, 3, 128