SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
Métodos, Modelos y Técnicas
De alto rendimiento de secuenciación de ADN,
conceptos y limitaciones
Martin Kircher y Janet Kelso !
Introducción
En 1977, el firstgenome, thatofthe
5.386 nucleótidos (nt), de un solo
strandedbacteriophagewX174, era
completamente
secuenciada [1] usingatechnologyinvented sólo unos
pocos años antes [2-5] .Sincethen thesequencing
ofwholegenomes, así como de los genes individuales
Regiones, así como se ha convertido en un foco
importante de
la biología moderna y completamente trans-
forman el campo de la genética.
ATTHE tiempo Ofthe de secuenciación
wX174, y durante casi una década,
Secuenciación de ADN Wasa apenas automático
acoplado y proceso muy tedioso whichinvolved
determinar sólo unos pocos nucleótidos Hun-Dred a
una time.In los late1980s, semi-
automatedsequencerswith mayor throughputbecame
vano-poder [6, 7], stillonly capaz de determinea
pocas secuencias ATA tiempo .Es posible el avance
en 1990swasthedevelopment theearly del conjunto
de capilares electro-foresis y apropiados de
detección sys-tems [8-12] .Como reciente como
1996, thesedevelopmentsconverged en ThePro-
ducción de un solo capillarysequencer comercial (ABI
Prism 310). En 1998, Thege Salud MegaBACE 1000 y
theABI Prism 3700 DNA Analyzer
becamethefirstcommercial96capillarysequencers, un
desarrollo que wastermed secuenciación de alto
rendimiento.
Overthelastdecade, alternativa
sequencingstrategieshavebecomeavailable [13-18],
que nos obliga a com-pletelyredefine''high-
throughputsequencing. '' Estos technologiesout-
realizar-theolderSanger sequencingtechnologies por un
factor of100-1,000in rendimiento diario, y
sametimereducethecostofsequencingonemillionnucleot
ides atthe (1 Mb) to4-0.1% de la asociada con
Sangersequencing.Toreflectthesehugechanges,
severalcompanies, investigación-res, y las recientes
revisiones [19-24] el uso theterm''next-
generationsequencing''instead de secuenciación de
alto rendimiento, sin embargo, este término en sí
mismo puede ser muy pronto
outdatedconsideringthespeedofongoingdevelopments.
DOI 10.1002 / bies.200900181
Departamento de Genética Evolutiva del Instituto Max
Planck de Antropología Evolutiva, en Leipzig, Alemania
*Autor correspondiente:
Janet Kelsoe-mail:
kelso@eva.mpg.de
Abreviaturas: A / C / G / T, Desoxiadenosina, desoxicitosina,
desoxi-guanosina, desoxitimidina;ATP,Trifosfato de adenosina;
dATPunaS, Desoxi-adenosina-5 '- (alfa-tio) trifosfato; CCD,
Dispositivo con carga acoplada,
es decir, el dispositivo semiconductor utilizado en las cámaras digitales;
Chip-Sec, Cromatina inmunoprecipitación Sequen-cing; CNV,
Número de copias variación; dNTP / PNT, Desoxi-
nucleótidos;ddNTPs, Didesoxi-nucleótidos (nucleótidos modificados
que faltan un hidroxilo
grupo en
el tercer átomo de carbono Ofthe azúcar);Georgia,
ShortforIllumina Analizador Genoma;InDel, Inserción /
deleción;kb / Mb / Gb, Kilobase (l03nt) / megabase (106nt) /
base giga (l09Nuevo Testamento);MeDIP-Sec, Metil-ación-
DependentImmuno-Precipitationsequen- cing; nucleótido (s)
nt;PCR,Reacción en cadena de la polimerasa;RNA-Seq,
SequencingofmRNAs / transcripciones;SABIOExpresión
SerialAnalysisofGene;SNP,Polimorfismo de nucleótido simple;
ARNm, El ARN mensajero / transcripciones.
Los recientes avances en la secuenciación del ADN han revolucionado el campo de la genómica, por lo que
es posible que incluso los grupos de investigación individuales para generar grandes cantidades de datos
ofsequence muy rápidamente y ATA tecnologías de alto throughputsequencing sustancialmente
lowercost.These hacer profunda transcriptquantification transcriptoma sequencingand, y la secuenciación
del genoma completo de resequencingavailable muchos más investigadores y projects.However, mientras
que el tiempo costand se han reducido en gran medida, los perfiles de error y las limitaciones de las
plataformas TheNew difieren significativamente de las de los anteriores de secuenciación Technol-gías. La
selección de una plataforma de secuenciación apropiado para determinados experimentos TIPOSDE es una
consideración importante,
y requiere una comprensión detallada
pie de las tecnologías disponibles; incluyendo fuentes de error, tasa de error, aswell como la velocidad y el
coste de la secuenciación. Se revisan los conceptos relevantes andcompare las cuestiones planteadas por
los sequencingtechnologies currenthigh-throughputDNA. Analizamos cómo los futuros desarrollos pueden
superar estos Limita-ciones y lo que sigue habiendo dificultades.
Palabras clave:.ABI / vida Sólidos tecnologías; Helicos HeliScope; Illumina Genoma Analizador; Roche / 454 GS FLX
Titanium; secuenciación capilar Sanger
524www.bioessays-journal.com Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
A continuación repasamos los cinco secuenciación
las tecnologías actualmente disponibles en themarket
(capillarysequencing, pyrose-secuenciación,
reversibleterminatorchem-terio, secuenciación por
ligación, y la química virtualterminator), discuten las
limitaciones intrin-sic ofeach, y proporcionan
anoutlook en la nueva technologieson
thehorizon.Weexplainhow thevastincreases en
throughputare associatedwith tanto nuevos y viejos
tipos de problemsin los datos de la secuencia
resultante, y
howtheselimitthepotentialapplicationsand plantean
desafíos para el análisis de datos.
secuenciación capilar Sanger
CurrentSangercapillarysequencingsystems, al
igual que el instrumento
AppliedBiosystems3xxxseriesortheGEHealthcare
MegaBACE ampliamente utilizado,
son
aún basado en la misma schemeapplied en general
en 1977 para lawX174 genoma [1,3] .First, millones
ofcopies ofthesequence que se determine se
purifiedor amplificada, dependiendo de la fuente
Ofthe synthesisis cadena sequence.Reverse realizado
en estas copias utilizando aknown cebado secuencia
ascendente Ofthe secuencia para determinar y
amixture ofdeoxy-nucleótidos ( dNTPs,
thestandardbuildingblocksofDNA) y didesoxi-
nucleótidos (ddNTP,
nucleótidos modificados falta un grupo hidro-Xil en el
tercer átomo de carbono de thesugar) .ThedNTP /
ddNTPmixturecauses al azar, no reversible termin-
ationoftheextensionreaction, la creación de los
diferentes ejemplares moles eculesextended a
differentlengths.Following desnaturalización y
nucleótidos upoffree limpias, cebadores, y theenzyme,
theresulting moleculesaresorted por su peso
molecular (corre-corres- al pointoftermination) y la
etiqueta pegada a la ddNTPs terminat-ción se lee de
forma secuencial enel orden creado por la etapa de
clasificación. representación Aschematic de disponible
en la Fig este processis. 1.
Clasificación por molecularweightwas
originalmente realizada usando gel electro-
foresis, pero se lleva a cabo hoy en día
bycapillaryelectrophoresis [7, 25].
Originalmente, radiactivo o opticallabelswere
aplicado en cuatro terminatorreactions diferentes
(cada uno ordenados y leer outseparately), pero hoy
en día cuatro de gripe orophores diferentes, uno por
cada nucleótido (A, C, G y T) se utilizan en una sola
reacción [6] .Additionally , el advenimiento de más
sensi-tivedetectionsystemsandseveralrounds de
extensiones de cebadores
(equivalenttoalinearamplification) cantidades
permitsmaller de ADN de partida a beused para
reacciones de secuenciación modernos.
Por desgracia, hay stilllittle forcreation auto-mación
Ofthe alta copyinputDNA con cebado conocida
sites.Typically esto se hace mediante la clonación,es
decir., La introducción de la secuencia diana en la
secuencia del vector aknown mediante ligadura
restrictionand proceduresand usando abacterialstrain
para amplificar el targetsequence en vivo - Por lo
tanto exploitingthelow
amplificationerrorduetoinherent corrección de
pruebas y reparación mech-anisms.However, este
proceso es verytediousand issometimeshamperedby
dificultades tales como la clonación
specificsequencesdue a theirbase compo-sición, la
longitud, y se utiliza
interactionswiththebacterialhostsystem.Althoughnoty
etwidely, integrado micro-fluidicdeviceshavebeen
developedwhich tienen como objetivo automatizar el
ADN extrac -ción, in vitro amplificación, y sequenc-
ción en el mismo chip [26-29].
UsingcurrentSangersequencing
tecnología, itistechnically possibleforup 384
secuencias [29,30] ofbetween 600 y 1.000 longitud
ntin [23,31] para ser secuenciados en
parallel.However, éstos systemsare 384-capilar rara.
El más estándar de 96
capillaryinstrumentsyieldamaximum ofapproximately
6 Mb ofDNA sequenceperday, con
costsforconsumablesamounting a alrededor de $ 500
por
1 Mb.
Figura 1.Representación esquemática de la secuenciación de Sanger proc-ess. Entrada
de ADN se fragmenta y se clonó en bacterias vectores para
en vivoamplificación. síntesis de la cadena inversa se lleva a cabo en las copias
theobtained a partir de una secuencia de cebado conocido y utilizando amixture ofdeoxy-
nucleótidos (dNTPs) y didesoxi-nucleótidos (ddNTPs). La mezcla de dNTP / ddNTP provoca
la extensión azar
para ser terminado no reversible, creando de manera diferente extendida mol-
ecules.Subsequently, después de la desnaturalización, limpiar offree nucleoproteínas
mareas, los cebos, y la enzima, las moléculas resultantes se sortedusing electroforesis
capilar por theirmolecularweight (corre-corres- al pointoftermination) y la
fluorescentlabelattached a los ddNTPs de terminación se lee de forma secuencial.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 525
Métodos,ModelosyTécnicas
ThesequencingerrorobservedforSangersequencing
duetoerrors ismainly en la etapa de amplificación (a
Baja Velocidad cuando se hace en vivo), Naturalvar-
iance, y la contaminación en el sampleused, así como
el deslizamiento de la polimerasa atlow secuencias
complejidad como simplerepeats (número corto
tandemrepeats variables) y homopolímeros
(stretchesof el mismo nucleótido). Además,
lowerintensitiesandmissingterminationvariantstend a
conducir a la acumulación de sequencingerrors hacia
el final oflong combinación sequences.In separación
withreduced por el electrophore-sis, basemiscalls [32]
y deletionsincreasewith leer length.However, la tasa
de error promedio (promedio de las bases generales
de una secuencia) después sequenceend recorte es
normalmente muy baja, withan error cada 10.000-
100.000 nt [33].
Roche / 454 GS FLX
Titaniumsequencer
La plataforma de secuenciación 454 era
thefirstofthenewhigh rendimiento
themarket secuenciación platformson
(publicado en octubre de 2005). Esta basado
en el enfoque de pirosecuenciación desa-desa- por
Pal Nyre'n y Mostafa Ronaghiatthe RoyalInstitute
tecnologia, Estocolmo en 1996 [34] .En la tecnología
contrasttothe Sanger, pyrosequencingis basado en
iterativa
complementingsinglestrandsandsimultaneouslyreadi
ng fromthenucleotidebeingincorporated (también
llamada secuenciación por síntesis, secuenciación
durante la extensión) outthesignalemitted .
Electro-
foresis tanto, ya no requiredto generar una ordenada
lectura de thenucleotides, Asthe leer outisnowdone
simultáneamente con la sequenceextension.
Inthepyrosequencingprocess
(Fig.2), un nucleótido tiempo ata
iswashedoverseveralcopiesofthesequenceto
bedetermined, causingpolymerases para incorporar
el núcleo-marea si es complementario a la cadena
tem-placa. La incorporación se detiene Siel tramo
longestpossible ofcomp-
lementarynucleotideshasbeen
sintetizado por la polimerasa. En el
proceso de incorporación, uno pyrophos-fosfato
pernucleotide isreleased andconverted de ATP por
un ATP sulfurylase.The ATP impulsa la reacción luz
de Luci-ferases presentand la
lightsignalismeasured.TopreventthedATP emitida
proporcionan para reactionfrom secuenciación que
se utiliza directamente en la lightreaction, desoxi-
adenosina-5
0
- (unatio) -
trifosfato (dATPunaS), que no es
asubstrateoftheluciferase,
isusedforthebaseincorporation reaction.Standard
nucleótidos de desoxirribosa
son
utilizado para todos los otros nucleótidos. Después
de casquillo-Turing la intensidad de la luz, los
nucleótidos se remainingunincorporated
washedawayandthenextnucleotideisprovided.
En 2005, la tecnología de pirosecuenciación
fue paralelizado en una placa picotituladora by454
Ciencias de la Vida (más tarde comprada por Roche
Diagnostics) para permitir alta throughputsequencing
[16] .El secuenciación platehas unos dos millones de
pozos - cada uno ofthem abletoaccommodateexactly
un 28-mtalón m de diámetro cubierto con
Figura 2.El proceso de pirosecuenciación. Uno de los cuatro nucleótidos iswashed
secuencialmente sobre copias de la secuencia que se determine, haciendo que las
polimerasas de incorporar incorporación nucleotides.The complementaria se detiene si
el tramo más largo posible del vano-ablenucleotidehasbeensynthesized.Intheprocessof
incorporación, uno pernucleotide pirofosfato se libera andconverted de ATP por
un ATP sulfurylase.The ATP impulsa el lightreaction ofluciferasespresentand un
lightsignalproportional (dentro de unos límites) a las incorporaciones
numberofnucleotide puede bemeasured.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
526 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
se determinarán copias de una sola hebra de la
sequenceto. Las cuentas son
incubatedwithapolymeraseandsingle-
strandbindingproteinsand, perlas de togetherwithsmaller
que llevan las luciferasas de azufre-ylasesand ATP,
gravitationallydeposited en los pocillos. nucleotidesare
libre luego se lava sobre el flujo de células yla luz emitida
durante el Incorpora-ción se captura para todos los pozos
en parallelusing una alta resolución de carga-
coupleddevice (CCD), características exploitingthelight-
transporte de
el plato
usado.
Una Ofthe principales requisitos para
la aplicación de esta serie basada en pyrosequenc-
ingapproach iscoveringindividualbeads con múltiples
copias del samemolecule. Esto se realiza por primera
creatingsequencinglibrariesin que
everyindividualmolecule recibe dos
differentadaptersequences, uno atthe 50endand uno
en el 30final de la molecule.In el caso de la / Roche
preparación sequencinglibrary 454 [16], esto se hace
bysequentialligation oftwo oligos pre-Synthes-zados.
Uno de los adaptadores añadió iscomplementary a
oligonucleótidos enel perlas de secuenciación y, por
tanto allowsmolecules para ser unido a las perlas
byhybridization.Low molécula-a-beadratios y la
amplificación de la secuencia de doble cadena hybri-
dized en thebeads (keptseparate usando
emulsionPCR) hace itpossible para crecer beadswith
miles ofcopies OFA
singlestartingmolecule.Usingthesecondadapter, perlas
cubiertas con moleculescan beseparated de perlas
vacías (usando perlas de captura especiales con oligo-
nucleótidos complementarios al adaptador sec-ond) y
arethen utilizados enla asdescribedabove reacción de
secuenciación.
La sustitución promedio (excluyendo
inserción / deleción, InDel tasa de error) es enel
intervalo de 10 "3
-10"4[16, 35], que es
higherthantheratesobservedforSangersequencing,
butis la sustitución ERRORRATE lowestaverage
ofthenew tecnologías de secuenciación
discussedhere.As mencionados earlierfor
Sangersequencing, in vitro amplificaciones por-
formados para la secuenciación preparationcause
una tasa de error de fondo superior,
es decir., El error introducido en la
samplebeforeitentersthesequencer.Inaddition,
inbeadpreparation (es decir., PCR en emulsión) una
fracción Ofthe beadsend hasta
carryingcopiesofmultiple
differentsequences.These''mixedbeads '' van a
participar en un alto incorporaciones numberof por
ciclo de flujo, como resultado-ción en la secuenciación
readsthatdo notreflectrealmolecules.Mostofthesereads
se filtran automáticamente duringthe software de post-
procesamiento del filtrado data.The de granos mixtos
puede, cómo-ever , causar un agotamiento de
sequenceswith real de una alta fracción
ofincorporationsper ciclo de flujo.
Alargefractionoftheerrors
observadas para este instrumento son smallInDels, en
su mayoría derivados de
inaccuratecallingofhomopolymerlength, andsingle
deleciones de pares de bases o insertionscaused por
thresholdingissues señal-ruido [35]. La mayoría de
estos problemas Canbe resuelto por una mayor
cobertura. Por mucho(>10 nt) homopolímeros, sin
embargo, a menudo Thereis una longitud miscall
coherente thatis notresolvable por la cobertura [35-37]
.Stronglightsignalsin onewellofthe PicoTiterPlate
también puede resultininsertions en secuencias en
neighboringwells. Si el pozo vecino está vacía,
thiscangenerateso-calledghostwells,es decir., Pozos
para el cual un signalisrecorded pesar de que
contienen plantilla noSequence; por lo tanto, los Inten-
sidades medidos son completamente causedby
sangrado a lo largo de la señal del vecino-ing
wells.Computationalpost-proceso-ción puede corregir
estos artefactos [38] .Como para la secuenciación de
Sanger, el rateincreaseswiththepositioninthesequence
error. En el caso de la secuencia 454, esto es causado
por una reducción en enzymeefficiency o pérdida de
enzimas (resultingin una reducción de la intensidad de
señal), algunas moléculas ya no ser elong-ado y byan
increasingphasingeffect.Phasingisobserved cuando
apopulation de moléculas de ADN amplifiedfrom
thesamestartingmolecule ( ensemble) se secuencia, y
describesthe proceso en el que no todas las moléculas
intheensembleareextended en everycycle. Esto hace
que las moléculas en theensemble perder sincronía /
fase, andresultsin un oftheprecedingcycles de eco que
se añaden a la señal como el ruido.
Thecurrent454 / RocheGSFLX
plataforma de titanio hace posible tosequence
alrededor de 1,5 millones de tales beadsin un solo
experimento y para determinesequences oflength
entre 300 and500 nt. La longitud de la lee es deter-
minado por el número de ciclos de flujo
(thenumberoftimesallfournucleotides
se lavan sobre la placa) como wellasby la composición
de base y el orden Ofthe bases en la secuencia a
disuadir-minadas. Actualmente, 454 / Roche limita
thisnumber a 200 ciclos de flujo, lo que resulta Inan
longitud averageread esperado ofabout400
nt.Thisislargely debido tolimitationsimposed por los
efficiencyofpolymerases y luciferasas,
cual
cae sobre la carrera de secuenciación, resultingin
disminuyó plataformas qualities.Currentlythe base
permite about750 secuencia Mb ofDNA que se creará
perdaywith costes de unos 20 $ / Mb.
Illumina Genome Analyzer II / IIx
Thereversibleterminatortechnologyused por el
Illumina Genome Analyzer (GA) employsasequencing-
por-sin-tesis conceptthatis similarto thatused en
Sangersequencing,es decir.theincorporation reacción
se detuvo aftereach base, la etiqueta de la base
incorp corporado-se lee con tintes fluorescentes, y la
reacción de secuenciación es entonces con-continuó
con la incorporación ofthenext de base [13, 39] (Fig.
3).
Like454 / Roche, theIllumina
protocolrequires secuenciación thatthesequences que
se determinen son acondicionado verted en una
biblioteca de secuenciación especial, lo que les
permite ser amplificado andimmobilized para la
secuenciación [13, 40]. Forthis propósito dos
adaptadores diferentes areadded al 50y 30extremos
de todos MOL-ecules utilizando la ligadura de los
llamados forkedadapters.1La biblioteca es entonces
amplifiedusing secuencias de cebador más largo,
cual
extendandfurtherdiversifytheadapters para
crear la finalsequenceneeded en pasos
posteriores.
Thisdouble-strandedlibraryis
meltedusingsodium hydroxidetoobtainsingle-
strandedDNAs, whichare luego se bombea a un muy
bajo concen-tración a través de los canales de una
célula de flujo. Esta celda de flujo tiene en su
superficie twopopulationsofimmobilizedoligonu-
cleotidescomplementarytothetwodifferentsingle
hebra adapterendsof la secuenciación library.These
oligo-nucleotideshybridizetothesingle-
1
Los híbridos de oligonucleo- parcialmente complementaria
mareas creando un extremo de doble cadena con un
Toverhang, con un de cadena sencilla y un differentsequence
en el otro extremo.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 527
Métodos,ModelosyTécnicas
moléculas de la biblioteca varados.por inversa
síntesis de la cadena a partir de la parte hybri-dized
(de doble cadena), el
newstrandbeingcreatediscovalentlybound a la celda de
flujo. Si este nuevo strandbends más y se une a otro
oli-gonucleotide complementaria a la secuencia
adaptador sec-ond en el extremo libre Ofthe hebra,
que puede ser utilizado para sintetizar una segunda
strand.Thisprocessofbending inverso unido
covalentemente y síntesis reversestrand, llamado
puente amplifi-cación, se repite severaltimes
andcreates grupos de varios 1.000 copiesofthe
originalsequence en muy closeproximity de la otra en
la celda de flujo [13, 40].
Estos grupos distribuidos al azar
contienen
moleculesthatrepresenttheforwardaswellasreversestra
ndsof las secuencias originales. Antes de disuadir a-la
minería de la secuencia, uno de los
strandshastoberemovedtopreventitfrom
obstaculizando los
reactionstericallyorbycomplementarybasepairing.Stra
nds de extensión son modificaciones de forma
selectiva cleavedatbase ofoligonucleoti-des en el
strandremoval cell.Following flujo, cada grupo en los
cellconsists flujo deHabitación trenzado, copias
identicallyoriented Ofthe misma secuencia; que
puede ser secuenciado por hibridación
el cebador de secuenciación en los
adaptersequences y comenzar la química
reversibleterminator.
'' '', Solexasequencing asitwas
introducedinearly2007, initiallyallowed para la
administración simultánea sequenc-ción de varios
millones de Sequen-ces muy cortos (nt atmost26)
inasingleexperiment.In los últimos años se havebeen
severaltechnical, química, andsoftware updates.The
producto, whichisnow llama
theIlluminaGenomeAnalyzer, ha aumentado
clusterdensities celda de flujo (más de 200 millones
clus-tersperrun), un widerrangeoftheflow
cellisimaged, andsequencereads de hasta 100 nt
pueden ser generated.A technicalupdate también
permitió thesequencingofthereversestrand ofeach
molecule.Thisisachieved bychemicalmelting y lavado
awaythe secuencia sintetizada,
la repetición de una
síntesis de la cadena
bridgeamplificationcyclesforreverse pocos, y luego
selec-tivelyremovingthestartingstrand (de nuevo
usando modificaciones de bases de
el
celloligonucleotide poblaciones de flujo),
beforeannealing anothersequencingprimer para
el segundo read.Using this''paired-
endsequencing''approach,
approximatelytwicetheamountofdata puede
haber generated.The Illumina
libraryandflowcellpreparationincludes variosin vitro
amplificationsteps, lo que causa un alto grado
backgrounderror y contribuir a la tasa ofabout10
averageerror"2-10"3[41,42] .Further, theflow fracción
cellpreparationcreatesa ofordinary-
lookingclustersthatare inició a partir de secuencias de
calidad mostlylow uno signalsand
individualsequence.Theseresultsin mixta morethan de
estos clusters.Similarto the454 ghostwells,
theIllumina identifychemistrycrystals imagen
analysismay, polvo, andlintparticles como racimos y
llaman sequencesfrom these.In tales casos, las
resultingsequences típicamente parecen ser de
complejidad lowsequence.
Como es el caso para las otras plataformas,
La tasa de error aumenta con increasingposition en los
sequence.This determinada se debe principalmente a
la eliminación gradual, proceso de secuenciación
whichincreasesthebackgroundnoiseassequencingprogr
esses.Whiletheensemble de piro-
sequencingcreatesuni-directionalphasing, crea
reversible terminador sequenc-ción bi-
directionalphasing [41,43] como algunos incorporan
también nucleotidesmay fallar a darse por terminada
correctamente -permitiendo la extensión de la
secuencia
por otro nucleótido en el mismo ciclo.
Figura 3.Terminator química reversible aplicada por los cebadores Illumina GA.Sequencing
se recuecen a los adaptadores de la sequencesto determinar. Las polimerasas se utilizan
para ampliar las sequencingprimers por incorporación offluorescently etiquetados y
terminatednucleotides.The incorporación se detiene inmediatamente después de The
firstnucleotide debido a la terminators.The polymerasesand libre
nucleótidos son lavados y la etiqueta de las bases incorporatedfor cada secuencia se lee
con cuatro imágenes tomadas a través differentfilters (filtro de nucleótido T se indica en la
figura)
y el uso de dos
láseres diferentes (rojo: A, C y verde: G, T) para iluminar fluorophores.Subsequently, los
fluoróforos y terminadores se eliminan yla secuenciación continuó con la incorporación
de la base siguiente.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
528 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
Con increasingcyclenumbers, theintensities extraen
de la clustersdecline [41, 43, 44]. Esto es debido a
fewermolecules que participan en el
extensionreaction como resultofnon-
reversibletermination, o debido a la atenuación
effectsof los fluoróforos de secuenciación. En
earlyversions Ofthe química, uno
ofthefluorophorescould becomestucktothe grupos
que crean otra fuente ofincreased ruido de fondo
[41].
la
simultaneousidentificationoffourdifferentnucleot
ides es también un cuestión.La GA utiliza
fourfluorescentdyes todistinguish los
fournucleotides A, C,
G, y T.Of estos, dos pares (A / C y G / T) excitado
usando el mismo láser, son
similarin theiremission espectros andshow única
separación limitado el uso de filtros Opti-cal. Por lo
tanto, las mayores errores substi-tución son
observadas entre A / Cy G / T [41, 42].
A pesar de que el Illumina GA lee
mostrar ahigheraverageerrorrate, un errorrange
wideraverage, y areconsiderablyshorterthan
454 / Rochereads, el GA
instrumentdeterminesmore de 5.000 Mb / día
con un priceofabout0.50 $ / Mb.This es más
thansix veces mayor rendimiento diario
y
foraconsiderablylowerpricepermegabase.
Applied Biosystems SóLIdAS
Theprototypeofwhatwasfurtherdevelopedandlatersol
dbyLifeTechnologies / Applied Biosystems (ABI)
como la plataforma de secuenciación sólida,
wasdeveloped por Harvard
MedicalSchoolandtheHowardHughesMedicalInstitute
y publicados en 2005 [17] .Con
itscommercialreleasein finales
2007, sólido fue sólo el tercer newhigh-
throughputsystem mercado enteringahighly
competitiva con todo threevendorsselling
theirinstrumentsforaroundhalfamilliondollars.TheChu
rch laboratorio de la Universidad de Harvard
MedicalSchoolcontinuedthedevelopmentofthesystem
andnow offersacheaper (<$ 200.000) SourceVersion
abierta Ofthe sistema (llamado Polonator) en colab-
oración con el sistema de Dover. En el thirdquarter
de 2008, un com-biotecnología empresa de
Mountain View, California,
namedCompleteGenomicsstartedoffering una
tecnología genoma humano sequencingservice.Their
se basa también
ontheChurchlabsequencing por ligadura de
concepto, pero itwitha combina nueva estrategia
libraryconstruction ofsequencing y la secuencia
immobiliz-ación utilizando círculo amplificación de
laminación [45]. Aquí, nos centramos en el sistema
commercialSOLiD ya que esta es la aplicación más
extendida de este concepto.
Theprinciplebehind sequencing-
por la ligadura isvery differentFrom
theapproachesdiscussedthusfar.Thesequence
reacción de extensión no es coche-Ried polimerasas
outby butrather byligases [17] (véase la Figura 4
para un schematicrepresentation Ofthe plat-forma
sólida 2/3) .Inthesequencing por ligationprocess, es
un cebador de secuenciación hybri-dized de copias
de una sola hebra de
el
moléculas de la biblioteca para ser
sequenced.Amixture sondas OF8-mer que llevan
fourdistinctfluorescentlabels compiten forligation
al cebador de secuenciación.
la
codificación fluoróforo, que es BasedOn los dos
30-mostnucleotides oftheprobe, se ofrecen las
bases read.Three incluidoel tinte se escinden
del 5
0
final de
la sonda, dejando una libre 50
fosfato de
la extendida (por cinco nucleótidos) pri-mer, que a su
vez está disponible para furtherligation.After múltiples
ligaduras (typi-camente hasta 10 ciclos), el
synthesizedstrandsaremelted y theligationproductis
arrastrado ante un newsequencingprimer
(shiftedbyonenucleotide) se annealed.Starting fromthe
nueva secuenciación el cebador ligationreaction se
repite. El mismo proceso isfollowed para otros tres
cebadores, facili-litar la lectura de la
dinucleotideencoding para cada posición de inicio en
thesequence.Usingspecificfluorescentlabelencoding, el
colorante salidas leídas (es decir.colors) se puede
convertir en una secuencia [46]. Esta conversión de
tosequence espacio de color requiere un firstbase
conocido, que es la última base de la
libraryadaptersequence.Given utilizado un
referencesequence, esto allowsdetection sistema de
codificación ofmachineerrorsand theapplication ofan
errorcorrection toreduce la theabsence promedio
errorrate.In de una secuencia de referencia, la forma
de la historia, color la conversión falla con un errorin el
tinte leer outand causesthesequence aguas abajo
Ofthe errortobe incorrecta.
Para la paralelización, la secuenciación
copias processusesbeadscoveredwithmultiple Ofthe
secuencia para bedetermined. Estas perlas se crean
en
de una manera similar a la descrita oído-lier para la
plataforma 454 / Roche. En contraste con-a la
tecnología 454 / Roche,
el
sólido sistema hace un Nouse forfixation
PicoTiterPlate Ofthe granos en proceso de
thesequencing; en lugar de la 3
0
extremos
de las secuencias en las perlas se modi-ficado de
manera thatallows obligado a becovalently en un
glassslide.As para el sistema de Illumina GA, este cre-
ates una dispersión aleatoria de las cuentas enla
cámara de secuenciación y permite densidades de
carga forhigher. Sin embargo dispersión, Ran-dom
complica la identi-ficación de las posiciones de
cuentas de las imágenes, y da lugar a la posibilidad
de que los cristales químico-cal, polvo y partículas de
pelusa canbe identificado erróneamente
asclusters.Further, la dispersión de los resultados de
los granos en una distancias widerangeofinter-grano ,
whichthen tienen diferente susceptibilidad a
beinfluenced por señales de neighboringbeads.
Tipos y causas de los errores de secuencia
son diversos: primero, la in vitro pasos amplifica-ción
causan un mayor backgrounderror rate.Secondly,
perlas que llevan amixture de secuencias y los granos
en closeproximity a falsereads uno anothercreate y
baja bases.Further calidad, disminución de la señal,
una pequeña phasingeffect regular,
andincompletedyeremovalresult en el aumento de
error como el ligationcyclesprogress [47] .Phasing,
asdescribed anteriormente, es una plataforma de
minorissue onthis como secuencias no extendedin el
último ciclo son no reversible ter-
minatedusingphosphatases.Sincehybridization
proceso estocástico isa, esto provoca una reducción
considerable enel número ofmolecules participatingin
subsequentligation reacciones,
andthereforesubstantialsignaldecline.On Por otro lado,
dado el efficiencyof fosfatasas la
phasingeffectcanbeconsideredverylow.However
restante, ofthedyes de escisión incompletas pueden
permitir la escisión en la reacción nextligation, que
luego allowsfor la extensión en el
nextbutonecycle.This causa una additionalnoise
differentphasingeffectand de colorantes de
theprevious de ciclo en el proceso de identi-ficación
colorante.
El sólido sistema permite en la actualidad
ofmore secuenciación de 300 millionbeads en
paralelo, con un typicalreadlength de entre 25
y 75 nt.
En el
momento de escribir, el sólido sistema ABI
istherefore comparable a la Illumina GA
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 529
Métodos,ModelosyTécnicas
sistema en términos de rendimiento y
pricepermillionnucleotides (#5,000 Mb / día,#0,50 $ /
Mb) .Average errorratesare, sin embargo, que
dependen del genoma de referencia OFA-vano
capacidad para errorcorrection (10
"3
-10"4vs. 10"2-10"3). En
theabsenceofa referencegenome, montaje y
consensuscalling El procedimiento puede realizarse
sobre la base de tinte leer outs (los llamados
colorspacesequences) toreduce los errores antes de la
conversión enel secuencia de nucleótidos. Si hay
referencegenome está disponible para la corrección de
errores, y no hay consenso callingis montaje y realiza,
a continuación, el error medio rateis superior a la de la
Illumina GA.
Helicos HeliScope
Helicos es la firstcompany a sellasequencer capaz de
secuenciar individualmolecules en lugar ofmolecule
ENSEM-bles creados por una amplificación proc-ess.
la secuenciación de una sola molécula tiene bybiases
theadvantagethatitisnotaffected o errores
introducidos en un paso librarypreparation o
amplificación,
y
puede facilitar ofminimalamounts de secuenciación
de entrada DNA.Using methodsable para detectar los
nucleótidos no estándar, sino que también podría
tener en cuenta las modificaciones del ADN
identificationof, perdió comúnmente enel in vitro
proceso de amplificación.
El HeliScope, como el sequenceris Helicos llamada, se
vendió por primera vez en marzo de 2008, y para el
final Ofthe firstquarter of2009 única
fourmachineshavebeeninstalled en todo el mundo.
Esto podría ser sur la extracción con palanca dadas
las ventajas de
soltero
moleculesequencing, butprobablyreflects tanto las
limitaciones específicas ofthisplatform, theprice
(dólares aboutonemillion), y un relativamente
smallmarket que ya ha invertido exten-vamente en
las nuevas tecnologías de secuenciación.
Thetechnologyapplied (figura 5)
que podría denominarse
virtualterminatorchemistry asíncrono [15]
.InputDNAisfragmentedandmeltedbefore
una
Figura 4.secuenciación de Solid Applied Biosystems por imprimación
ligation.Asequencing se hibrida con las copias de una sola hebra de Sequen-ces que se
determinen. Octamer sondas se hibridan, se ligan a thesequencing cebador, y un tinte
fluorescente en el 5
0
final del ligado
8-mer sondas, la codificación de los dos 30
nucleótidos -la mayoría de la sonda, es
leer dephosphorylated.Threenucleotides primersare extendidos-out.Non de la
sonda que incluye el colorante se escinden, creando un
libre 50fosfato para más ligaduras múltiples ligations.After, hebras thesynthesized se
funde y el producto de ligación es washedaway antes de una nueva, nucleótidos
desplazada por un cebador de secuenciación isannealed.Starting de la nueva
ligationreaction secuenciación primerthe se repeated.The mismo se hace forthree
otherprimers , lo que permite la lectura de la etiqueta dinucleótido
para cada posición en
la secuencia.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
530 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
poli-A-tailissynthesized molécula ontoeachsingle hebra
usando una polimerasa poli-ciclasa. En la última etapa
ofpolyadenylation, se añade un labeledadenine con
fluorescencia. La biblioteca es washedover un flujo
cellwhere poli-A tailsbind a poli-T
oligonucleotides.Thebound coordenadas en la celda
de flujo aredetermined utilizando una fluorescencia de
basedread fuera del flujo thesecoordinates cell.Having
detectadas, la fluorescentlabel de la 30adenina se
elimina
andthesequencingreactionstarted.Polymerasesare
lavó a través de theflow célula con un tipo de
nucleótido fluorescentlylabeled (A, C, G, o T) en atime
y las polimerasas se extienden thereverse hebra de
las secuencias startingfrom la incorporación de poli-T
oligonucleotides.Thenucleotide Ofthe poli-merases se
ralentiza por el etiquetado fluor-escent y permite
como máximo
una constitución antes de polímero-asa se elimina
por lavado junto con los nucleótidos Thenon-
Incorporated (termedvirtualtermination [48,49]). El
flowcellisthen fotografiado de nuevo, los tintes Fluor-
escent se eliminan, y la reac-ción continuó con otra
nucleotide.By este molécula proceso notevery
isextended en cada ciclo, que es whyit es una
secuenciación proc-ess asíncrono que resulta en
secuencias ofdifferentlength (como es el caso para
el 454 / Rocheplatform).
Ya que soltero moleculesare
secuenciado, siendo débil measuredare las señales, y
no hay posibilidad thatmisincorporationerrorscan
Becor-rected por un conjunto effect.Due enel hecho
de que las moléculas se unen enel celda de flujo sólo
por hibridación, thereis la posibilidad de que las
moléculas plantilla canbe pierden en el lavado
steps.In adición,
moleculesmay beirreversibly termi-nado por la
incorporación de nucleótidos incorrectlysynthesized.
En general, se lee
tienen entre 24 y 70 nt de longitud (nt average32) [50] y
por lo tanto más corto que para theother plataformas.
Debido a la mayor num-ber de secuencias determinadas
en paralelo, el rendimiento total por día (4150 Mb /
daywith un coste de #0,33 $ / Mb [50]) está en thesame
rango que forthe GA y SOLiDsystems.The tasa de error
promedio, whichisin la gama OFA pequeño tanto por
ciento, isslightly superior a la de todos los demás instru-
mentos y sesgada hacia Indeles sustituciones mas bien
que.
Aplicaciones y
generalconsiderations
Allcurrenthigh-throughputtechnol-gías tienen
un error medio tasa que
Figura 5.la química virtualterminator asíncrono realizado byThe ADN HeliScope.Input se
fragmenta, se derritió, y RELAClONADAS-polyadeny. Un adenina marcado con
fluorescencia se añade en el último paso. Thissingle de hebra de ADN se lava a través
de una celda de flujo
con poli-T oligo-
nucleótidos que permiten la hibridación. Las coordenadas consolidados sobre la
cellare flujo determina utilizando el marcado con fluorescencia adenines.Having las
coordenadas identificadas, el fluorescentlabelofthe 30adeninas se
removed.Polymerases se lavan a través con una
escriba nucleótidos de la etiqueta fluorescente (A, C, G y T) a la vez, y las polimerasas
se extienden la cadena inversa de las secuencias de
a partir de los oligonucleótidos de poli-T. El nucleótido Incorpora-ción de las
polimerasas se ralentiza por la labelingand fluorescente permite a lo sumo una
incorporación antes de la polimerasa iswashed away.The Cellis flujo entonces
fotografiado, la fluorescentdyesremoved, y la reacción continuó con otro nucleótido.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 531
Métodos,ModelosyTécnicas
es considerablemente más alto que el /
10,000to1 / 100,000observedforhigh calidad
typical1
Sanger secuencias.
Además, theGSFLX titanio, GA, y plataformas
HeliScope SOLiD eachhave Limita-ciones biasesand
muy específicas, por lo que es necesario escoger
aplatform apropiado para una aplicación específica
proyec-ector (para un resumen verTabla 1). Una
combinación de tecnologías [51-54] y protocolos
experimentales [55-57] También puede ser apropiado,
y evencomplementary, para proyectos específicos.
De alto qualitySangersequencing
isnow commonlyused a generatelow-cobertura de la
secuenciación de individualpositions y regiones (p.ej.,
Diagnosticgenotyping)
genomes.AstheSangersequencelengthislongerthanmo
stabundantshortrepeat clases enteras y
orthesequencingofvirus--fago de tamaño, que permite
a los unambigu-ousassemblyofmostgenomicregions -
algo thatis generallynotpossibleusing
theshorterreadplatforms.However, la tecnología y
isexpensive demasiado lento para las muestras
sequencinglarge, extendidos genómicos re-regiones, o
las muchas moléculas
requiredforquantitativeapplications [p.ej., La
expresión génica cuantificación; cro-Matin
inmunoprecipitación sequenc-ing (chip-ss.),
Andmethylation dependiente de inmunoprecipitación
Sequen-cing (MeDIP-Sec)]
termsofsequencenumberandhastheadvantage
ForquantitativeapplicationstheHeliScopeprovidesthehi
ghestthroughputin de no requerir un protocolo de
preparación multisteplibrary. En el AT-herhand, el
HeliScope ofrece thelowest resolución en la
cartografía accuracyfor genomas complejos debido a
su corta readlength y errorprofile.TheGA orSOLiD
resultados cuantitativos para
platformsmaythusprovideequivalent dantes-cationes,
mientras que proporciona menos pero lon-
gerreadsandrequiringamoreelaborate preparación
biblioteca.
A pesar de que aún no ha sido totalmente analógica
lyzed, es posible (e incluso probable) thatlibrary
protocolos de preparación podrían biasthe
representación secuencia en una muestra [42, 58,
59], por lo que la sustitución ofthisstep un
importantgoal.Further, de múltiples etapas biblioteca
preparación
protocolsrequirehigheramountsofinputmaterial,
limitando theirgeneralappli-cation.However,
protocolsforlibraryconstructionfromlimitedsample
cantidades están disponibles orbeing desa-desa- para
cada una de las plataformas, y Pub-publica-
demuestran que, si bien vendorprotocols indican la
necesidad forhighersamplequantities (rango
microgramos), muchos usuarios están procediendo
cantidades de ADN de entrada successfullywith bajas
(nanogramto rango de picogramos), como, por
ejemplo, , las muestras de ADN fromancient [60-62].
Al igual que la secuenciación de Sanger, el GS FLX
El titanio proporciona una longitud de leer lapso de
Ning muchas de las secuencias repetidas cortas
- Un assemblyofgenomes
importantfeatureforaccuratesequencemappingand
[63] .A pesar de los errores indel, esta tecnología
tiene índices muy bajos ofmisidentifying bases
individuales, makingit perfectamente adecuado para
los identificationofsinglenucleotidepolymorphisms
(SNP). También dirigido a los identificationofSNPs,
atleastfor muestras con anexistingreferencegenome,
instrumento istheSOLiD con su
dinucleotideencodingscheme [46]
.Considerablyhighercoverage se necesita para
llamar performSNP con una precisión similar
usingtheIlluminaGA [64] .NeithertheIllumina GA ni
los sistemas sequenc-ing SOLiD ABI son propensos a
generar highrates de indeles pequeñas, haciéndolos
wellsuited para el estudio de la variación InDel.
Como se mencionó anteriormente, el inconveniente
ofshortreads (por debajo de about75 nt) obtenidos a
partir de Helicos, sólido, orGAinstrumentsisin
genomeassemblyand aplicaciones de mapas, donde
theplacementofrepeated orvery similarsequences no
se pueden resolver UNAMBIG-nuamente. La
colocación correcta se furthercomplicated por altas
tasas de error intro-ducing una distancia
requirementfora minimumsequence ofan
unambiguousplacement. -Extremo emparejado o de
yerba mate de par ayuda a favor de los protocolos
para superar algunos de theselimitations de corta lee
[65] por la información Provid-ción acerca de la
orientación relativa locationand
ofapairofreads.Currently un protocolo de extremo
emparejado se aplica onlycommonly en el GA,
whilemate-pairprotocolsareavailableforSOLiD, GS FLX
Titanium, y GA.Inpaired de fin de secuenciar el real
extremos
moléculas de ADN de más bien cortas (<1 kb)
aredetermined, whilemate-pairsequencing requiere la
preparación deOferta bibliotecas. En estos protocolos,
theends de moléculas más largas, tamaño
seleccionado (p.ej., 8, 12, o 20 kb) están conectados
withan secuencia adaptador interno en un circu-
larizationreaction.Thecircular
molécula se procesa a continuación, utilizando
enzimas restric-ción orfragmentation beforeouter
adaptadores biblioteca se añaden dos extremos del
aroundthe molécula combinada.
la
adaptador interno se puede entonces utilizar como
moléculas
additionalsequencingreactiononthesameimmobilized
una segunda sitio de cebado FORAN. Por lo tanto,
compañero-pairsequencingprovidesdistanceinfor-
mación usefulforassembly, butdoesnot permitir la
fusión de los dos se superpone a finales lee, ya que
por themolecules de diseño no se solaparán en
sequenc-ing.However, la fusión de los dos se
superponen-ping avance y retroceso endreads
pareadas de corto inserto bibliotecas allowsthe
reconstrucción OFA completa con-
secutivemoleculesequence, longerthan la longitud
individualread, ycon las tasas de error promedio de
reducción en theoverlapping secuencia de parte [60,
66].
Debido a las grandes cantidades de secuencial
ces creadas, hay interés en regiones seleccionadas
sequenc-ing (p.ej.agenomiclocus, desde
sequencecaptureexper-iments [67-69]) en múltiples
individuos / samplesinsteadofsequencingonesamplein
excessivedepth.Alltech-gías, por tanto, proporcionan
una placa separationoftheirsequencing en
definedregions o channels.However, como máximo, 16
tales regiones / canales están disponibles (GS FLX
Titanium y placas HeliScope), que, no tengan el
sufficientforsomeapplications. El uso de diferentes
bibliotecas con-structionprotocols, además
someplatformsallow de muestra de código de barras
específico (a veces llamado '' index '') secuencias enel
molecules.These biblioteca moleculescan entonces
besequenced en thesameregion / canal,
andlaterseparated (computacionalmente) theirbar
basa en la secuencia de código [70-73 ].
esto facilita
altamente parallelsequencing LargeNumber OFA de
las muestras más allá de que los possibleusing
(protocolos mostlynon proveedores) physicallane /
channelsepar-ation.Currently tales protocolos
disponibles forthe GS FLX Titanium, GA, y
SOLiDinstrument.
Aunque los precios de secuenciación por giga-
de base han disminuido considerablemente en los
últimos años a, haciendo Proyecto Genoma
projectslikethe1000Human Variación,
1001Arabidopsis thaliana Proyecto genomas,
theMammalianGenomeProject,
ortheInternationalCancerGenomeConsortium
posible, de alta throughputsequencing adquisición
stillhashigh, el funcionamiento y los costes de
mantenimiento,
cual
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
532 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
no se incluyen en la Tabla 1. Además, eachof estas
plataformas requiere una managementandanalysis
datos substantialinvestmentin, tiempo y personal [74-
77] grupos de investigación .Smaller todavía puede
encontrar
prohibitivos los costos de la infrastructureneeded para
almacenar, manipular y ana-lizarla severaltens de
gigabytes de datos y terabytes de puresequence
varios
miles de archivos intermedios generados instrumentos
bythese cada semana. Incluso para
mayores, centros de genoma experimentados
thisaspect sigue siendo una cada vez mayores Chal-
lengefortheongoinguseoftheseplatforms.
próximas promociones
Motivado bythegoalofa $ 1.000 genoma Fijado por
el NIH / NHGRIto enablepersonalized la medicina,
los throughputofallsystems descrito es constante
y el aumento de los números dados
herearerapidlyoutdated.However, inaddition a las
mejoras de currenttechnologies,
includingtheJanuary2010
announcementoftheIlluminaHiSeq sistema de 2000,
que determinessequences de clusters en el fondo y
topof la celda de flujo y procesa dos celdas de flujo en
paralelo, una nueva generación ofsequencers ya está
en el horizonte.
WhatstartedwiththeHelicos
sistema - la secuencia de un solo mol-ecules sin
amplificación previa preparationor biblioteca -
probablemente se convierta en apopular paradigma.
En concreto, tres OT-sus sistemas han captado la
atención de medios andscientific WELLIN avance
oftheir
real Disponibilidad: Pacific
nanoporos Bioscience'sSingleMoleculeRealTime
(SMRT) sequencingtechnology [18], BASE-Technol gía
de Oxford nanoporos [14] y, recientemente, la
propuesta de IBM-ofsilicon basa [78].
PacificBiosciences'SMRT technologyperformsthe
reacción de secuenciación onsilicon dióxido de
chipswith un 100 nmmetalfilm
containingthousandsoftens-de-
nanometerdiameterholes, los llamados guías de onda
en modo cero (ZMWs) [79]. Cada ZMW se utiliza como
una cámara de nano-visual-ización, proporcionando un
detectionvolume de 20 zeptoliters (10
"21
l). en este
volumen, una sola molécula puede ser illu-minated
excluyendo otros labelednucleotides en el fondo -
savingtime y química de secuenciación por omitir-
ting etapas de lavado. Un ADN único polímero-asa
está fijada a la parte inferior de la
surfacewithinthedetectionvolume, andnucleotides,
con
differentdyes
unido a la cadena de fosfato,
areusedinconcentrationsallowingnormal
procesividad de la enzima. Como las pol-
ymeraseincorporatescomplementarynucleotides,
thenucleotideisheldwithin Fortens volumen de
detección
Tabla 1. Comparación de las tecnologías de secuenciación de alto rendimiento disponibles
rendimiento Longitud Calidad costos aplicaciones Las principales fuentes de errores
La tabla resume el rendimiento, la duración, la calidad y los costes para las versiones actuales de las tecnologías mencionadas. estos aproximada
los números están en constante mejora y en base a las cifras disponibles en enero de 2010. Los costos hacen instrumentacquisition notinclude y
mantenimiento; aún pueden verse afectados por los descuentos y los efectos de escala para múltiples instrumentos. Cuando los números son muy similares, colorsranging de rojo
rendimiento) a verde (buen rendimiento) indican una tendencia general. En la última columna, aplicaciones de ejemplo perfiles de error de ajuste thethroughputand ofeach Ofthe
plataformas son given.Typically, esto hace notmean thatthe tecnología se limita a theseapplications, pero que actualmente es el más adecuado para este tipo de aplicaciones.
þ
Alta profundidad secuenciación / número de pasadas requeridas.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 533
Métodos,ModelosyTécnicas
ofmilliseconds, ordersofmagnitudelongerthan
forunspecificdiffusionevents. De esta manera el tinte
fluorescente
oftheincorporatednucleotidecanbeidentified durante
la síntesis normal de reversestrand velocidad [79] .En
pilotexper-iments, Pacific Biosciences tiene
shownthatitstechnology allowsfordirectsequencing
OFA pocos miles
basesbeforethepolymeraseisdenatureddue a la
lectura láser outofthe tecnología dyes.The SMRT está
destinado forrelease en 2010.Even aunque se
necesita furtherdevelopment para crear un
morerobustsystem, la omisión oflibrarypreparation y
amplificación así como seguir las secuencias largas
generadas
willundoubtedlyprovideanadvantageoverthecurrentsy
stemsformanyapplications.
BASE tecnología de Oxford nanoporos
es poco probable que sea lanzado pronto como
modificaciones
astheSMRTtechnology.BASEoffersthepotentialtoi
dentifyindividualnucleotide (p.ej.
5-metil-
citosinavs.cytosine) proceso duringthesequencing [14].
La idea behindthis tecnología es la
ofindividualnucleotides de identificación utilizando un
changein el potencial de membrana, ya que de paso a
través de una modificación una-hemolisina de poro
mem-brana con un sensor de ciclodextrina [14, 80]. Sin
embargo, la aplicación de este Technol-logía para la
secuenciación, el poro tiene que befused a una
exonucleasa, que degradessingle-
strandedDNAsequencesandreleases
individualnucleotides en thepore. Además, la
tecnología needsto ser paralelizado en formato de
matriz, beforeits liberación como un alto rendimiento
sequenc-ción platform.While la sensibilidad
forindividualnucleotidemodificationsseemsto ser un
majoradvantage,
thedestructivefashionoftheoutlinedsequencing proceso
podría ser forApplications considereda obstáculo con
muestras de pre-preciosas, y que no permite una
segunda ciclo de lectura para la reducción de error.
A principios de octubre de 2009, IBM emitió una
Comunicado de prensa [78] describe un método toslow
la velocidad ofan individualDNA cadena que pasa a
través de un nano-pore.For este fin developeda de
múltiples capas de metal / dieléctrico nanoporedevice
que utiliza la interacción de cargas theDNA columna
vertebral con un campo eléctrico RELAClONADAS-modu
para atrapar y slowlyreleases una tecnología
individualDNA molecule.The descrito podría Theor-
éticamente combinarse con, por ejemplo,
las tecnologías desarrolladas Nanopore atHarvard
Universidad [81] o la base previouslydescribed
technologywhereitmay superar la destructiva
approachfollowed hasta ahora.
Conclusión
Currenthigh-throughputsequencingtechnologies
proporcionan una gran variedad
ofsequencingapplicationstomanyresearchersandproje
cts.Giventheimmense la diversidad, hemos notdis-
terco estas aplicaciones en profundidad aquí, otras
opiniones con unas fuertes aplicaciones onspecific
focales y analysisare datos disponibles [24, 82-88].
Los discussedtechnologies hacen posible que
evensingle grupos de investigación para generar
largeamounts de muy rapidlyand atsubstantially
lowercosts
thantraditionalSangersequencing.Whilecosts se han
reducido a menos than4-0.1% y el tiempo ha sido un
factor de shortenedby 100-1.000 sobre la base de
datos de secuencias, dailythroughput
theerrorprofilesandlimitations observados para el plat
nuevas formas de differsignificantly
Sangersequencing y entre approaches.Further, cada
uno de estos nuevos sequencingplatforms requiere
additionalinvestments sustanciales - factores
thathave oftennot hacer hincapié suficiente en
researchpublications que describe una específica apli-
cation.Somevendorshaverecentlystarted para ofrecer
versiones de presupuesto de theirinstruments (p.ej.
Illumina GA IIe o 454 / Roche GS Junior) con
sequencingcapacity.However menor, precio
whiletheinstru-ment es más bajo, la financiera
invertirá-ment permanece high.Costs por base
aregenerally superior a la de la standardinstrument, y
verysimilaroverallinfrastructureisstillrequired.Oftenthe
elección de una adecuada sequencingplatform es
projectspecific y algunos
timescombinationscanbeadvan--
tageous.Thismayopen themarketfurtherto
companiesproviding
secuenciación-en-demandservices, butwill no
reemplaza la necesidad de laboratoriesto invertir un
tiempo considerable y exper-Tise tanto en la
producción de análisis librariesand Ofthe
vastquantities ofdata que se generará.
Las nuevas tecnologías en el horizonte,
SMRT por Pacific Biosciences, BASE byOxford
nanoporos, y othertechnol-gías como
thatsuggested por IBM,
demostrar el futuro importante directionsin el campo
de la secuenciación de ADN: el Abil-dad de usar
moléculas individuales withoutany preparación
biblioteca o la amplificación, la identificación de
nucleotidemodifications específicos, y la capacidad de
gener comió-secuencia más larga lee. Estos debuta
de desa- facilitarán futuras investigaciones inmany
campos, hacer más fácil el análisis de datos, y los
costos de secuenciación furtherreduce,
hopefullyachievingtheaim OFA $ 1.000 genoma
humano sugiere byNIH / NHGRI que se requiere para
la medicina-zado personal.
Expresiones de gratitud
Agradecemos a los miembros Ofthe Salida-
mentofEvolutionaryGenetics, los miembros de la
andparticularly sequencingGroup, forproviding
datafrommultipleplatforms de secuenciación,
aswellasinteresting usefulinsights.We discussionsand
también están en deuda con
A.Wilkinsandthethreeanonymousreviewersforcriticalr
eadingofthemanuscriptand thoughtfulcomments.This
trabajo fue apoyado por la Sociedad Max Planck.
referencias
1.Sanger F,GM aire,BarrellBG,et.1977.Nucleotide
secuencia de ADN ofbacteriophage phiX174. Naturaleza
265: 687-95.
2.Gilbert W,Maxam A.nucleotidesequence 1973.The del
operador lac. Proc Natl AcadSciUSA 70: 3581-4.
3.SangerF,Nicklen S,Coulson
AR.1977.DNAsequencingwithchain-
terminatinginhibitors.ProcNatlAcadSciUSA 74:
5463-7.
4.Sanger F, Coulson AR. 1975. Una rápida methodfor
determinar las secuencias en el ADN por primedsynthesis con
ADN polimerasa. J Mol Biol 94:
441-8.
5.Wu R, Kaiser AD. 1968. Estructura y basesequence en los
extremos cohesivos de ADN lambda-fago ofbacterio. J
MOLBIOL35: 523-37.
6.Smith LM,Sanders JZ,KaiserRJ,et.
detección 1986.Fluorescence en análisis de la secuencia
automatedDNA. Naturaleza 321: 674-9.
7.Swerdlow H,Gesteland
R.1990.Capillarygelelectrophoresis para la secuenciación
rápida resolutionDNA, alta.NucleicAcidsRes18:
1415-9.
8.Zagursky RJ,McCormick RM.1990.DNAsequencing
separaciones en geles capilares en amodified instrumento
de secuenciación de ADN comercial
ambiente. Biotechniques 9: 74-9.
9.Huang XC, Quesada MA, Mathies RA. 1992.DNA
secuenciación capilar usando matriz electro-foresis.
AnalChem 64: 2149-54.
10.Kambara H,TakahashiS.analizador de capillaryarrayDNA
1993.Multiple-sheathflow.
Naturaleza 361: 565-6.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
534 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas
11.Ueno K,Yeung ES.fragmentos
1994.Simultaneousmonitoring ofDNA separados por
electroforesis en una matriz de multiplexado de
100capillaries. AnalChem 66: 1424-1431.
12.kimś,YooHJ,HahnJH.1996.Postelectrophoresiscapillary
exploración
secuenciación método forDNA.AnalChem68: 936-9.
13.Bentley DR, balasubramanian S,
SwerdlowHP,et.2008.Accuratewholehuman
la secuenciación del genoma usando la química termin
ator reversible. Naturaleza 456: 53-9.
14.Clarke J, Wu HC, Jayasinghe L, et al. identificación de la
base 2009.Continuous para single-mol
eculenanoporeDNAsequencing.NatNanotechnol4:
265-70.
15.Harris TD,Buzby PR,Babcock H,et.
La secuenciación del ADN de una sola molécula de 2008.
de aviralgenome. ciencia 320: 106-9.
dieciséis.Margulies M, Egholm M, WE Altman, et al.
2005. La secuenciación del genoma en microfabricatedhigh
densidad picolitros reactores.Naturaleza 437: 376-80.
17.Shendure J, Porreca GJ, REPPAS NB, et al.
2005. Accurate multiplex polony sequencingof un genoma
bacteriano evolucionado. ciencia 309: 1728-1732.
18.Korlach J, marcas PJ, Cicero RL, et al. pasivación de
aluminio para 2008.Selective dirigida
inmovilización de ADN polimerasa MOL-ecules individuales
en cero en modo de guía de ondas nanostruc-turas. Proc
NatlAcad SciUSA 105: 1176-1181.
19.Ansorge WJ.2009.Next generación, técnicas de
Secuenciación del ADN.NatBiotechnol25:
195-203.
20.MardisER.2008.Next generación, métodos
Secuenciación del ADN.Annu Rev Genómica
Hum Genet 9: 387-402.
21.Schuster CAROLINA DEL SUR.2008.Next generación
secuenciación transforma la biología de
hoy.NatMethods 5: 16-8.
22.Shendure J,JIH.2008.Next generación, la secuenciación
del ADN.NatBiotechnol26: 1135-
45.
23.Shendure JA,Porreca GJ, Iglesia GM.
2008.Overview ofDNA secuenciación Strat-tegias.Curr
protoc MOLBIOLCapítulo 7: Unidad
7.1.
24.Metzker ML. 2010. Las tecnologías de secuenciación
- la próxima generación. Nat Rev Genet 11: 31-
46.
25.George KS, Zhao X, Gallahan D, et al.
1997.Capillaryelectrophoresismethodologyfor
identificación de genes relacionados con el cáncer patrones
expre-sión de reacción en cadena de displaypolymerase
diferencial fluorescente.J Chromatogr BBiomed SciAppl695:
93-102.
26.BlazejRG,P Kumaresan,MathiesRA.
2006.Microfabricated bioprocessor para inte-rallado
nanolitros escala de ADN Sanger sequenc-ción. Proc
NatlAcad SciUSA 103: 7240-5.
27.Mariella R Jr. 2008. Preparación de la muestra: theweak
eslabón de bio-detección basada en la microfluídica.
Microdispositivos Biomed 10: 777-84.
28.Roper MG,Easley CJ,Legendre LA,et al.
2007. sistema de control de temperatura por infrarrojos fora
chainreaction completamente noncontactpolymerase en
chips de microfluidos.AnalChem79: 1294-1300.
29.Emrich CA, Tian H, Medintz IL, et al.
2002.Microfabricated 384 carriles conjunto de capilares
elec-
Bioanalyzer trophoresis para el análisis de ultra-alta-a
través putgenetic.AnalChem 74: 5076-
83.
30.Shibata K,Itoh M,Aizawa K,et.2000.RIKEN Análisis de la
secuencia integrada (RISA)
sistema - 384 formato de la tubería con la secuenciación
384 secuenciador multicapilar.Genome Res10: 1757-
1771.
31.HertDG,Fredlake CP,Barron AE.2008.Advantages y
limitaciones ofnext-generación
tecnologías de secuenciación ación: a
comparisonofelectrophoresis y no electrophoresismethods.
electroforesis 29: 4618-26.
32.Ewing B,Hillier L,WendlMC,et.1998.Base Insultos de
trazas secuenciador automático
usingphred.I.Accuracyassessment.Genome Res 8:
175-85.
33.Ewing B,P. Verde1998.Base-llamando sequencertraces
ofautomated utilizando Phred.
II.Errorprobabilities.GenomeRes8: 186-94.
34.RonaghiM,Karamohamed S,Pettersson
segundo,etTiempo de liberación .1996.Real
ofpyrophosphate detección sequencingusing
ADN.AnalBiochem 242: 84-9.
35.Quinlan AR,StewartDA,Stromberg
MP,et.2008.Pyrobayes: Una base mejorada
descubrimiento callerforSNP en
pyrosequences.Métodos Nat 5: 179-81.
36.T mimbre, E Schlagenhauf, Un Graner, et al.
2006. 454 secuenciación puso a prueba utilizando
thecomplex genoma de la cebada. BMC Genomics 7:
275.
37.RE verde, Malaspina AS, Krause J, et al.
2008. Una completa
Neandertalmitochondrialgenomesequencedetermined
byhigh-throughputsequencing.Celda134: 416-
26.
38.RE verde,Krause J,Ptak
SE,et.2006.Analysisofonemillionbasepairsof
NeanderthalDNA. Naturaleza 444: 330-6.
39.TurcattiG,Un romieu,Fedurco M,et.
2008. Una nueva clase fluorescentnucleotides
ofcleavable: síntesis y optimización de síntesis
terminadores asreversible sequencingby forDNA.
Nucleic Acids Res 36: E25.
40.Fedurco M,Un romieu,Williams S,et.
2006.BTA, un novelreagent para el ADN adjuntar-menton
vidrio y colonias de ADN amplificados efficientgeneration
fase ofsolid. NucleicAcids Res 34: E22.
41.KircherM,StenzelU,KelsoJ.aprendizaje automático
2009.ImprovedbasecallingfortheIlluminaGenome
Analyzerusing
estrategias. Biol genoma10: R83.
42.Dohm JC, Lottaz C, Borodina T, et al.
2008.Substantialbiases de datos ultra-shortread
establece a partir de la secuenciación de ADN de alto
rendimiento.Nucleic Acids Res 36: E105.
43.Y Erlich,Mitra PP,delaBastide M,et.
2008.Alta-cíclica: la secuenciación Aself-
optimizingbasecallerfornext generación.NatMethods
5: 679-82.
44.RougemontJ,Un Amzallag,IseliC,et.
2008.Probabilistic base de datos llamando
ofSolexasequencing. BMC Bioinf. 9: 431.
45.R Drmanac,Sparks AB,Callow MJ,et.
2010.Humangenomesequencingusingunchained
readson base de nanoarrays auto-assemblingDNA.
ciencia 327: 78-81.
46.Applied Biosystems. UN Teórico
Comprensión de2 Base colorcodes andits
Aplicación a Anotación, error
Detección, andErrorCorrection.WhitePaper
SóLIdASTMSistema; 2008.
47.Dimalanta ET,Zhang L,Hendrickson
CL,et.2009.Increased Leer longitud en el
SólidoTMSequencingPlatform.PosterSOLiDTMSistema.
48.ZhuZ,WaggonerAS.1997.Molecularmechanism el control
de la incorporación de
fluorescentnucleotides en el ADN por PCR.citometría
28: 206-11.
49.Bowers J,MitchellJ,cerveza
E,et.2009.Virtualterminatornucleotidesfornext-
la secuenciación del ADN generación.NatMethods6:
593-5.
50.Pushkarev D,NeffNF,SR terremoto.2009.Single
secuenciación de moléculas individuales ofan
Genoma humano. Nat Biotechnol 27: 847-52.
51.Reinhardt JA,Baltrus DA,Nishimura MT,et al. conjunto de
2009. De novo usando bajo tura
tura datos de la secuencia corta leídos del ricepathogen
Pseudomonas syringae pv. oryzae.Genome Res 19: 294-
305.
52.DiguistiniS,Liao NY,Platt D,et.2009.De Novo secuencia
del genoma de montaje OFA
hongo filamentoso utilizando Sanger, 454 datos de
secuencia andIllumina.Biol genoma10: R94.
53.Miller JR, Delcher AL, Koren S, et al.
2008.Aggressiveassemblyofpyrosequencing
lee con compañeros.bioinformática 24: 2818-
24.
54.Chen W, R Ullmann, Langnick C, et al. análisis
2009.Breakpoint del cromosoma equilibrada
reordenamientos de secuenciación de próxima generación
de extremo emparejado.Eur J Hum GenetDol: 10.1038 / ejhg
.2009.21118 [Epub ahead of print].
55.Zimin AV, Delcher AL, Florea L, et al. 2009.A ensamblaje
del genoma completo Ofthe doméstica
vaca, Bos taurus. Biol genoma10: R42.
56.Zhou X,Su Z,Sammons RD,et.2009.Novelsoftware
Paquete forcross-platformtranscriptomeanalysis
(CPTRA).BMC
Bioinf. 11: S16.
57.Kim JI, Ju YS, parque H, et al. 2009. Un
highlyannotatedwhole-genomesequenceofa
Corea del individuo. Naturaleza 460: 1011-5.
58.Linsen SE, de Wit E, Janssens G, et al. 2009.Limitations y
posibilidades ofsmallRNA
digitalgeneexpressionprofiling.NatMethods 6: 474-6.
59.QuailMA,Swerdlow H,Turner DJ.2009.Improved
protocolos para la Illumina Genoma
Analyzersequencing sistema.CurrProtocHum Genet
Capítulo 18: Unidad de 18.2.
60.Briggs AW, Stenzel U, Meyer M, et al. 2009.Removal de
citosinas deaminados y detección
ción deen vivo metilación en ancientDNA.Nucleic
Acids Res 38(6): e87 [Epub aheadof de impresión].
61.T Maricic,Pääbo S.2009.Optimization of454 preparación
biblioteca de secuenciación de pequeños
cantidades de ADN permite secuencia de determi-nación
ofboth cadenas de ADN.Biotechniques46: 51-2, 54-7.
62.N Rohland, Horfreiter M.2007. Comparisonand extracción
de optimización ofancientDNA.
Biotechniques 42: 343-52.
63.Wheeler DA, Srinivasan M, Egholm M, et al.
2008. El genoma completo de un individualby secuenciación
del ADN masivamente paralelo. Naturaleza452: 872-6.
64.O Harismendy, PC ng, Strausberg RL, et al.
2009. Evaluación de los estudios sequenc-
ingplatformsforpopulationtargetedsequencing de próxima
generación. Biol genoma10: R32.
sesenta y cinco.Chaisson MJ, Brinza D, Pevzner PA.
ensamblaje fragmento de novo con 2009.De corta mate-
emparejado lee: ¿Es importante la longitud de leer?
Genome Res 19: 336-46.
66.Krause J, Briggs AW, Kircher M, et al. 2009.A ADNmt
genoma completo de un mo- temprana
ern humana de Kostenki, Rusia.Curr Biol20: 231-6.
67.Un Gnirke, Un Melnikov, Maguire J, et al. 2009.Solution
selección de híbridos con oli- ultra-larga
gonucleotides para masivamente paralelo dirigida
secuenciación. Nat Biotechnol27: 182-9.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 535
Métodos,ModelosyTécnicas
68.Hodges E,Rooks M,Xuan Z,etla selección de los
intervalos de .2009.Hybrid genómicas discretas
en microarrays de diseño personalizado Formas-
sivelyparallelsequencing.NatProtoc4: 960-74.
69.Briggs AW, bueno JM, RE verde, et al.
2009.Targetedretrievalandanalysisoffive
NeandertalmtDNA genomas.ciencia 325: 318-21.
70.MeyerM,StenzelU,HofreiterM.secuenciación
2008.Paralleltagged en la plataforma 454
formar. Nat protoc 3: 267-78.
71.Meyer M,StenzelU,Myles S,et.2007.Targetedhigh-
Throughputsequencingof
etiquetados muestras de ácidos nucleicos.AcidsRes
nucleicos 35: E97.
72.Y Erlich,Chang K,A Gordon,et.2009.DNA Sudoku - el
aprovechamiento de alto rendimiento
secuenciación de muestras multiplexadas Analy-sis.
Genome Res 19: 1243-1253.
73.Meyer M, Kircher M. 2010. Illumina sequenc-ing preparación
para la biblioteca altamente multiplexados
orientar la captura y secuenciación.Fría SpringHarb
protoc DOI: 10.1101 / pdb.prot5448.
74.pop M,Salzberg SL.2008.Bioinformaticschallenges ofnew
tecnología de secuenciación.
Trends Genet 24: 142-9.
75.Richter BG, Sexton DP. 2009. La gestión de
andanalyzingnext-generationsequencedata.
PLoS Comput Biol5: E1000369.
76.codornices MA, me Kozarewa, Smith F, et al. mejoras de
2008. Una gran centro al genoma
sistema de secuenciación de Illumina. Métodos Nat 5:
1005-1010.
77.BatleyJ,EdwardsD.2009.Genomesequence datos:
gestión, almacenamiento, andvisualization. Biotechniques
46: 333-4, 336.
la investigación tiene como objetivo 78.IBM
Research.2009.IBM tobuild secuenciador de ADN para
ayudar a nanoescala unidad
costos bajos de análisis genético personalizado. InLoughran
M, ed .; Notas de prensa, Vol. 2009.new York: IBM.
79.Eid J, Un Fehr, Gray J, et al. 2009. Real-timeDNA
secuenciación de una sola moles polimerasa
ecules. ciencia 323: 133-8.
80.Y Astier, O Braha, Bayley H. 2006.
TowardsinglemoleculeDNAsequencing: directa
ofribonucleoside identificación y deoxyri-bonucleoside
50-monophosphates por usingan ingeniería de
proteínas nanoporos EQUIPPEDWITH un
molecularadapter.Soc J Am Chem128: 1705-1710.
81.Albertorio F, Hughes ME, Golovchenko JA,et.2009.Base
DependentDNA-carbono
interacciones de nanotubos: la activación
enthalpiesand montaje disassemblycontrol.Nano-
tecnología 20: 395.101.
82.Medvedev P,Stanciu M,Brudno
M.2009.Computationalmethodsfordiscovering
structuralvariationwithnext-generationsequencing.
Métodos Nat 6: S13-20.
83.PepkeS,Wold B,MortazaviA.2009.ComputationforChIP-
seqandRNA-seqstudies. Métodos Nat 6: S22-32.
84.FlicekP,BirneyE.2009.Sensefromsequence lee: métodos
de alineación y
Asamblea. Métodos Nat 6: S6-12.
85.Parque PJ.2009.ChIP-ss: ventajas andchallengesofa
tecnología de maduración.Nat
Rev Genet 10: 669-80.
86.WallPK,Leebens-J Mack,ChanderbaliAS, et al. 2009.
Comparación de la próxima generación
sequencingtechnologiesfortranscriptomecharacterizatio
n. BMC Genomics 10: 347.
87.Holt RA, SJ Jones. 2008. La nueva secuenciación celda de
flujo paradigmof. Genome Res 18: 839-
46.
88.DalcaAV,BrudnoM.2010.Genomevariationdiscoverywith
high rendimiento
los datos de secuenciación. Breve Bioinf. 11: 3-14.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
536 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas

Más contenido relacionado

La actualidad más candente

secuenciación por el medoto de sanger
secuenciación por el medoto de sangersecuenciación por el medoto de sanger
secuenciación por el medoto de sangerwlarakc
 
REACCIÓN EN CADENA DE LA POLIMERASA
REACCIÓN EN CADENA DE LA POLIMERASAREACCIÓN EN CADENA DE LA POLIMERASA
REACCIÓN EN CADENA DE LA POLIMERASAVICTOR M. VITORIA
 
Reporte práctica #3
Reporte práctica #3Reporte práctica #3
Reporte práctica #3Hugh1993
 
Tecnologías que se utilizan para el estudio del
Tecnologías que se utilizan para el estudio delTecnologías que se utilizan para el estudio del
Tecnologías que se utilizan para el estudio delbiologiaquimicamontclar
 
Seminario biologia molecular UPB 2013-02
Seminario biologia molecular UPB 2013-02Seminario biologia molecular UPB 2013-02
Seminario biologia molecular UPB 2013-02erika2013
 
Seminario biologia (1)
Seminario biologia (1)Seminario biologia (1)
Seminario biologia (1)erika2013
 
Biologia molecular 2_clase
Biologia molecular 2_claseBiologia molecular 2_clase
Biologia molecular 2_clasemarcelajacobi27
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genéticamerchealari
 
T Ecnicas De Adn Recombinante
T Ecnicas De Adn RecombinanteT Ecnicas De Adn Recombinante
T Ecnicas De Adn Recombinanteguest940c24
 
Biologia molecular y ingenieria genetica
Biologia molecular y ingenieria geneticaBiologia molecular y ingenieria genetica
Biologia molecular y ingenieria geneticaDimitri Valenzuela
 
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesMétodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesBiocientificaSA
 
hibridación de ácidos nucleicos
hibridación de ácidos nucleicoshibridación de ácidos nucleicos
hibridación de ácidos nucleicosLeón Leon
 

La actualidad más candente (20)

secuenciación por el medoto de sanger
secuenciación por el medoto de sangersecuenciación por el medoto de sanger
secuenciación por el medoto de sanger
 
Tec. De Secuenciacion
Tec. De SecuenciacionTec. De Secuenciacion
Tec. De Secuenciacion
 
REACCIÓN EN CADENA DE LA POLIMERASA
REACCIÓN EN CADENA DE LA POLIMERASAREACCIÓN EN CADENA DE LA POLIMERASA
REACCIÓN EN CADENA DE LA POLIMERASA
 
Reporte práctica #3
Reporte práctica #3Reporte práctica #3
Reporte práctica #3
 
Tecnologías que se utilizan para el estudio del
Tecnologías que se utilizan para el estudio delTecnologías que se utilizan para el estudio del
Tecnologías que se utilizan para el estudio del
 
Seminario biologia molecular UPB 2013-02
Seminario biologia molecular UPB 2013-02Seminario biologia molecular UPB 2013-02
Seminario biologia molecular UPB 2013-02
 
Seminario biologia (1)
Seminario biologia (1)Seminario biologia (1)
Seminario biologia (1)
 
Biologia molecular 2_clase
Biologia molecular 2_claseBiologia molecular 2_clase
Biologia molecular 2_clase
 
Biologia
BiologiaBiologia
Biologia
 
PcrGENETICA MOLECULAR
PcrGENETICA MOLECULARPcrGENETICA MOLECULAR
PcrGENETICA MOLECULAR
 
Snapgene informe
Snapgene informeSnapgene informe
Snapgene informe
 
RAPD-PCR
RAPD-PCRRAPD-PCR
RAPD-PCR
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genética
 
T Ecnicas De Adn Recombinante
T Ecnicas De Adn RecombinanteT Ecnicas De Adn Recombinante
T Ecnicas De Adn Recombinante
 
40270307
4027030740270307
40270307
 
Biologia molecular y ingenieria genetica
Biologia molecular y ingenieria geneticaBiologia molecular y ingenieria genetica
Biologia molecular y ingenieria genetica
 
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesMétodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
 
Aplicaciones PCR
Aplicaciones PCRAplicaciones PCR
Aplicaciones PCR
 
Biotecnología módulo 2
Biotecnología módulo 2Biotecnología módulo 2
Biotecnología módulo 2
 
hibridación de ácidos nucleicos
hibridación de ácidos nucleicoshibridación de ácidos nucleicos
hibridación de ácidos nucleicos
 

Destacado

Destacado (20)

871
871871
871
 
Enfermedades del sistema nervioo y de los cinco sentidos
Enfermedades del sistema nervioo y de los cinco sentidosEnfermedades del sistema nervioo y de los cinco sentidos
Enfermedades del sistema nervioo y de los cinco sentidos
 
847
847847
847
 
Jjp
JjpJjp
Jjp
 
Material Tecnología Educativa "1erParcial"
Material Tecnología Educativa "1erParcial"Material Tecnología Educativa "1erParcial"
Material Tecnología Educativa "1erParcial"
 
524
524524
524
 
1084
10841084
1084
 
Riesgos fisicos
Riesgos fisicosRiesgos fisicos
Riesgos fisicos
 
Expocion del humero
Expocion del humeroExpocion del humero
Expocion del humero
 
Licencias cc
Licencias ccLicencias cc
Licencias cc
 
Coms2003 week6
Coms2003 week6Coms2003 week6
Coms2003 week6
 
827
827827
827
 
Coincidencias con otras instituciones
Coincidencias con otras instituciones   Coincidencias con otras instituciones
Coincidencias con otras instituciones
 
882
882882
882
 
Sofás estrella
Sofás estrellaSofás estrella
Sofás estrella
 
Spring-2014-Chapman-Partnership-newsletter
Spring-2014-Chapman-Partnership-newsletterSpring-2014-Chapman-Partnership-newsletter
Spring-2014-Chapman-Partnership-newsletter
 
Digital Viagra - Creare Engagement con i Social Media
Digital Viagra - Creare Engagement con i Social MediaDigital Viagra - Creare Engagement con i Social Media
Digital Viagra - Creare Engagement con i Social Media
 
1055
10551055
1055
 
884
884884
884
 
Nopal
NopalNopal
Nopal
 

Similar a D912f51131ed787b91.en.es

TIB-SecuenciacionEnsamblado-2015-2016.pdf
TIB-SecuenciacionEnsamblado-2015-2016.pdfTIB-SecuenciacionEnsamblado-2015-2016.pdf
TIB-SecuenciacionEnsamblado-2015-2016.pdfCristVillar
 
Morales quispe leticia ines
Morales quispe leticia inesMorales quispe leticia ines
Morales quispe leticia inesleticiamorales38
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genéticamerchealari
 
Estructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfEstructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfDouglasGalvis1
 
Secuenciador automático con el sistema de electroforesis capilar basada en la...
Secuenciador automático con el sistema de electroforesis capilar basada en la...Secuenciador automático con el sistema de electroforesis capilar basada en la...
Secuenciador automático con el sistema de electroforesis capilar basada en la...judithnancy2
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionoxaljayos1
 
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsx
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsxPRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsx
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsxssuser40d9a5
 
8C153328-9163-4010-BD9F-F719C94C2555.pdf
8C153328-9163-4010-BD9F-F719C94C2555.pdf8C153328-9163-4010-BD9F-F719C94C2555.pdf
8C153328-9163-4010-BD9F-F719C94C2555.pdfMaraFernandaLinceCru
 
Secuenciacion del adn
Secuenciacion del adnSecuenciacion del adn
Secuenciacion del adnIPN
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispeleticiamorales38
 

Similar a D912f51131ed787b91.en.es (20)

SECUENCIAS MASIVAS.pptx
SECUENCIAS MASIVAS.pptxSECUENCIAS MASIVAS.pptx
SECUENCIAS MASIVAS.pptx
 
TIB-SecuenciacionEnsamblado-2015-2016.pdf
TIB-SecuenciacionEnsamblado-2015-2016.pdfTIB-SecuenciacionEnsamblado-2015-2016.pdf
TIB-SecuenciacionEnsamblado-2015-2016.pdf
 
Morales quispe leticia ines
Morales quispe leticia inesMorales quispe leticia ines
Morales quispe leticia ines
 
03-1-MarcaDirect
03-1-MarcaDirect03-1-MarcaDirect
03-1-MarcaDirect
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genética
 
Técnicas moleculares
Técnicas molecularesTécnicas moleculares
Técnicas moleculares
 
Estructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfEstructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdf
 
Secuenciador automático con el sistema de electroforesis capilar basada en la...
Secuenciador automático con el sistema de electroforesis capilar basada en la...Secuenciador automático con el sistema de electroforesis capilar basada en la...
Secuenciador automático con el sistema de electroforesis capilar basada en la...
 
Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacion
 
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsx
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsxPRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsx
PRESENTACIÓN PCR IRENE FERNANDEZ. biotecnología.ppsx
 
8C153328-9163-4010-BD9F-F719C94C2555.pdf
8C153328-9163-4010-BD9F-F719C94C2555.pdf8C153328-9163-4010-BD9F-F719C94C2555.pdf
8C153328-9163-4010-BD9F-F719C94C2555.pdf
 
Compendio Biología Molecular Parte 2
Compendio Biología Molecular Parte 2Compendio Biología Molecular Parte 2
Compendio Biología Molecular Parte 2
 
Metodos de secuenciacion
Metodos de secuenciacionMetodos de secuenciacion
Metodos de secuenciacion
 
Secuenciación
SecuenciaciónSecuenciación
Secuenciación
 
clase 281021.pptx
clase 281021.pptxclase 281021.pptx
clase 281021.pptx
 
Genetica Forense
Genetica ForenseGenetica Forense
Genetica Forense
 
Pcr
PcrPcr
Pcr
 
Secuenciacion del adn
Secuenciacion del adnSecuenciacion del adn
Secuenciacion del adn
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispe
 
Secuenciacion ADN
Secuenciacion ADNSecuenciacion ADN
Secuenciacion ADN
 

Último

Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptxolgakaterin
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfJonathanCovena1
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.amayarogel
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 

Último (20)

Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Ecosistemas Natural, Rural y urbano 2021.pptx
Ecosistemas Natural, Rural y urbano  2021.pptxEcosistemas Natural, Rural y urbano  2021.pptx
Ecosistemas Natural, Rural y urbano 2021.pptx
 
CLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdfCLASE - La visión y misión organizacionales.pdf
CLASE - La visión y misión organizacionales.pdf
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.La triple Naturaleza del Hombre estudio.
La triple Naturaleza del Hombre estudio.
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 

D912f51131ed787b91.en.es

  • 1. Métodos, Modelos y Técnicas De alto rendimiento de secuenciación de ADN, conceptos y limitaciones Martin Kircher y Janet Kelso ! Introducción En 1977, el firstgenome, thatofthe 5.386 nucleótidos (nt), de un solo strandedbacteriophagewX174, era completamente secuenciada [1] usingatechnologyinvented sólo unos pocos años antes [2-5] .Sincethen thesequencing ofwholegenomes, así como de los genes individuales Regiones, así como se ha convertido en un foco importante de la biología moderna y completamente trans- forman el campo de la genética. ATTHE tiempo Ofthe de secuenciación wX174, y durante casi una década, Secuenciación de ADN Wasa apenas automático acoplado y proceso muy tedioso whichinvolved determinar sólo unos pocos nucleótidos Hun-Dred a una time.In los late1980s, semi- automatedsequencerswith mayor throughputbecame vano-poder [6, 7], stillonly capaz de determinea pocas secuencias ATA tiempo .Es posible el avance en 1990swasthedevelopment theearly del conjunto de capilares electro-foresis y apropiados de detección sys-tems [8-12] .Como reciente como 1996, thesedevelopmentsconverged en ThePro- ducción de un solo capillarysequencer comercial (ABI Prism 310). En 1998, Thege Salud MegaBACE 1000 y theABI Prism 3700 DNA Analyzer becamethefirstcommercial96capillarysequencers, un desarrollo que wastermed secuenciación de alto rendimiento. Overthelastdecade, alternativa sequencingstrategieshavebecomeavailable [13-18], que nos obliga a com-pletelyredefine''high- throughputsequencing. '' Estos technologiesout- realizar-theolderSanger sequencingtechnologies por un factor of100-1,000in rendimiento diario, y sametimereducethecostofsequencingonemillionnucleot ides atthe (1 Mb) to4-0.1% de la asociada con Sangersequencing.Toreflectthesehugechanges, severalcompanies, investigación-res, y las recientes revisiones [19-24] el uso theterm''next- generationsequencing''instead de secuenciación de alto rendimiento, sin embargo, este término en sí mismo puede ser muy pronto outdatedconsideringthespeedofongoingdevelopments. DOI 10.1002 / bies.200900181 Departamento de Genética Evolutiva del Instituto Max Planck de Antropología Evolutiva, en Leipzig, Alemania *Autor correspondiente: Janet Kelsoe-mail: kelso@eva.mpg.de Abreviaturas: A / C / G / T, Desoxiadenosina, desoxicitosina, desoxi-guanosina, desoxitimidina;ATP,Trifosfato de adenosina; dATPunaS, Desoxi-adenosina-5 '- (alfa-tio) trifosfato; CCD, Dispositivo con carga acoplada, es decir, el dispositivo semiconductor utilizado en las cámaras digitales; Chip-Sec, Cromatina inmunoprecipitación Sequen-cing; CNV, Número de copias variación; dNTP / PNT, Desoxi- nucleótidos;ddNTPs, Didesoxi-nucleótidos (nucleótidos modificados que faltan un hidroxilo grupo en el tercer átomo de carbono Ofthe azúcar);Georgia, ShortforIllumina Analizador Genoma;InDel, Inserción / deleción;kb / Mb / Gb, Kilobase (l03nt) / megabase (106nt) / base giga (l09Nuevo Testamento);MeDIP-Sec, Metil-ación- DependentImmuno-Precipitationsequen- cing; nucleótido (s) nt;PCR,Reacción en cadena de la polimerasa;RNA-Seq, SequencingofmRNAs / transcripciones;SABIOExpresión SerialAnalysisofGene;SNP,Polimorfismo de nucleótido simple; ARNm, El ARN mensajero / transcripciones. Los recientes avances en la secuenciación del ADN han revolucionado el campo de la genómica, por lo que es posible que incluso los grupos de investigación individuales para generar grandes cantidades de datos ofsequence muy rápidamente y ATA tecnologías de alto throughputsequencing sustancialmente lowercost.These hacer profunda transcriptquantification transcriptoma sequencingand, y la secuenciación del genoma completo de resequencingavailable muchos más investigadores y projects.However, mientras que el tiempo costand se han reducido en gran medida, los perfiles de error y las limitaciones de las plataformas TheNew difieren significativamente de las de los anteriores de secuenciación Technol-gías. La selección de una plataforma de secuenciación apropiado para determinados experimentos TIPOSDE es una consideración importante, y requiere una comprensión detallada pie de las tecnologías disponibles; incluyendo fuentes de error, tasa de error, aswell como la velocidad y el coste de la secuenciación. Se revisan los conceptos relevantes andcompare las cuestiones planteadas por los sequencingtechnologies currenthigh-throughputDNA. Analizamos cómo los futuros desarrollos pueden superar estos Limita-ciones y lo que sigue habiendo dificultades. Palabras clave:.ABI / vida Sólidos tecnologías; Helicos HeliScope; Illumina Genoma Analizador; Roche / 454 GS FLX Titanium; secuenciación capilar Sanger 524www.bioessays-journal.com Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 2. A continuación repasamos los cinco secuenciación las tecnologías actualmente disponibles en themarket (capillarysequencing, pyrose-secuenciación, reversibleterminatorchem-terio, secuenciación por ligación, y la química virtualterminator), discuten las limitaciones intrin-sic ofeach, y proporcionan anoutlook en la nueva technologieson thehorizon.Weexplainhow thevastincreases en throughputare associatedwith tanto nuevos y viejos tipos de problemsin los datos de la secuencia resultante, y howtheselimitthepotentialapplicationsand plantean desafíos para el análisis de datos. secuenciación capilar Sanger CurrentSangercapillarysequencingsystems, al igual que el instrumento AppliedBiosystems3xxxseriesortheGEHealthcare MegaBACE ampliamente utilizado, son aún basado en la misma schemeapplied en general en 1977 para lawX174 genoma [1,3] .First, millones ofcopies ofthesequence que se determine se purifiedor amplificada, dependiendo de la fuente Ofthe synthesisis cadena sequence.Reverse realizado en estas copias utilizando aknown cebado secuencia ascendente Ofthe secuencia para determinar y amixture ofdeoxy-nucleótidos ( dNTPs, thestandardbuildingblocksofDNA) y didesoxi- nucleótidos (ddNTP, nucleótidos modificados falta un grupo hidro-Xil en el tercer átomo de carbono de thesugar) .ThedNTP / ddNTPmixturecauses al azar, no reversible termin- ationoftheextensionreaction, la creación de los diferentes ejemplares moles eculesextended a differentlengths.Following desnaturalización y nucleótidos upoffree limpias, cebadores, y theenzyme, theresulting moleculesaresorted por su peso molecular (corre-corres- al pointoftermination) y la etiqueta pegada a la ddNTPs terminat-ción se lee de forma secuencial enel orden creado por la etapa de clasificación. representación Aschematic de disponible en la Fig este processis. 1. Clasificación por molecularweightwas originalmente realizada usando gel electro- foresis, pero se lleva a cabo hoy en día bycapillaryelectrophoresis [7, 25]. Originalmente, radiactivo o opticallabelswere aplicado en cuatro terminatorreactions diferentes (cada uno ordenados y leer outseparately), pero hoy en día cuatro de gripe orophores diferentes, uno por cada nucleótido (A, C, G y T) se utilizan en una sola reacción [6] .Additionally , el advenimiento de más sensi-tivedetectionsystemsandseveralrounds de extensiones de cebadores (equivalenttoalinearamplification) cantidades permitsmaller de ADN de partida a beused para reacciones de secuenciación modernos. Por desgracia, hay stilllittle forcreation auto-mación Ofthe alta copyinputDNA con cebado conocida sites.Typically esto se hace mediante la clonación,es decir., La introducción de la secuencia diana en la secuencia del vector aknown mediante ligadura restrictionand proceduresand usando abacterialstrain para amplificar el targetsequence en vivo - Por lo tanto exploitingthelow amplificationerrorduetoinherent corrección de pruebas y reparación mech-anisms.However, este proceso es verytediousand issometimeshamperedby dificultades tales como la clonación specificsequencesdue a theirbase compo-sición, la longitud, y se utiliza interactionswiththebacterialhostsystem.Althoughnoty etwidely, integrado micro-fluidicdeviceshavebeen developedwhich tienen como objetivo automatizar el ADN extrac -ción, in vitro amplificación, y sequenc- ción en el mismo chip [26-29]. UsingcurrentSangersequencing tecnología, itistechnically possibleforup 384 secuencias [29,30] ofbetween 600 y 1.000 longitud ntin [23,31] para ser secuenciados en parallel.However, éstos systemsare 384-capilar rara. El más estándar de 96 capillaryinstrumentsyieldamaximum ofapproximately 6 Mb ofDNA sequenceperday, con costsforconsumablesamounting a alrededor de $ 500 por 1 Mb. Figura 1.Representación esquemática de la secuenciación de Sanger proc-ess. Entrada de ADN se fragmenta y se clonó en bacterias vectores para en vivoamplificación. síntesis de la cadena inversa se lleva a cabo en las copias theobtained a partir de una secuencia de cebado conocido y utilizando amixture ofdeoxy- nucleótidos (dNTPs) y didesoxi-nucleótidos (ddNTPs). La mezcla de dNTP / ddNTP provoca la extensión azar para ser terminado no reversible, creando de manera diferente extendida mol- ecules.Subsequently, después de la desnaturalización, limpiar offree nucleoproteínas mareas, los cebos, y la enzima, las moléculas resultantes se sortedusing electroforesis capilar por theirmolecularweight (corre-corres- al pointoftermination) y la fluorescentlabelattached a los ddNTPs de terminación se lee de forma secuencial. ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 525 Métodos,ModelosyTécnicas
  • 3. ThesequencingerrorobservedforSangersequencing duetoerrors ismainly en la etapa de amplificación (a Baja Velocidad cuando se hace en vivo), Naturalvar- iance, y la contaminación en el sampleused, así como el deslizamiento de la polimerasa atlow secuencias complejidad como simplerepeats (número corto tandemrepeats variables) y homopolímeros (stretchesof el mismo nucleótido). Además, lowerintensitiesandmissingterminationvariantstend a conducir a la acumulación de sequencingerrors hacia el final oflong combinación sequences.In separación withreduced por el electrophore-sis, basemiscalls [32] y deletionsincreasewith leer length.However, la tasa de error promedio (promedio de las bases generales de una secuencia) después sequenceend recorte es normalmente muy baja, withan error cada 10.000- 100.000 nt [33]. Roche / 454 GS FLX Titaniumsequencer La plataforma de secuenciación 454 era thefirstofthenewhigh rendimiento themarket secuenciación platformson (publicado en octubre de 2005). Esta basado en el enfoque de pirosecuenciación desa-desa- por Pal Nyre'n y Mostafa Ronaghiatthe RoyalInstitute tecnologia, Estocolmo en 1996 [34] .En la tecnología contrasttothe Sanger, pyrosequencingis basado en iterativa complementingsinglestrandsandsimultaneouslyreadi ng fromthenucleotidebeingincorporated (también llamada secuenciación por síntesis, secuenciación durante la extensión) outthesignalemitted . Electro- foresis tanto, ya no requiredto generar una ordenada lectura de thenucleotides, Asthe leer outisnowdone simultáneamente con la sequenceextension. Inthepyrosequencingprocess (Fig.2), un nucleótido tiempo ata iswashedoverseveralcopiesofthesequenceto bedetermined, causingpolymerases para incorporar el núcleo-marea si es complementario a la cadena tem-placa. La incorporación se detiene Siel tramo longestpossible ofcomp- lementarynucleotideshasbeen sintetizado por la polimerasa. En el proceso de incorporación, uno pyrophos-fosfato pernucleotide isreleased andconverted de ATP por un ATP sulfurylase.The ATP impulsa la reacción luz de Luci-ferases presentand la lightsignalismeasured.TopreventthedATP emitida proporcionan para reactionfrom secuenciación que se utiliza directamente en la lightreaction, desoxi- adenosina-5 0 - (unatio) - trifosfato (dATPunaS), que no es asubstrateoftheluciferase, isusedforthebaseincorporation reaction.Standard nucleótidos de desoxirribosa son utilizado para todos los otros nucleótidos. Después de casquillo-Turing la intensidad de la luz, los nucleótidos se remainingunincorporated washedawayandthenextnucleotideisprovided. En 2005, la tecnología de pirosecuenciación fue paralelizado en una placa picotituladora by454 Ciencias de la Vida (más tarde comprada por Roche Diagnostics) para permitir alta throughputsequencing [16] .El secuenciación platehas unos dos millones de pozos - cada uno ofthem abletoaccommodateexactly un 28-mtalón m de diámetro cubierto con Figura 2.El proceso de pirosecuenciación. Uno de los cuatro nucleótidos iswashed secuencialmente sobre copias de la secuencia que se determine, haciendo que las polimerasas de incorporar incorporación nucleotides.The complementaria se detiene si el tramo más largo posible del vano-ablenucleotidehasbeensynthesized.Intheprocessof incorporación, uno pernucleotide pirofosfato se libera andconverted de ATP por un ATP sulfurylase.The ATP impulsa el lightreaction ofluciferasespresentand un lightsignalproportional (dentro de unos límites) a las incorporaciones numberofnucleotide puede bemeasured. M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 526 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 4. se determinarán copias de una sola hebra de la sequenceto. Las cuentas son incubatedwithapolymeraseandsingle- strandbindingproteinsand, perlas de togetherwithsmaller que llevan las luciferasas de azufre-ylasesand ATP, gravitationallydeposited en los pocillos. nucleotidesare libre luego se lava sobre el flujo de células yla luz emitida durante el Incorpora-ción se captura para todos los pozos en parallelusing una alta resolución de carga- coupleddevice (CCD), características exploitingthelight- transporte de el plato usado. Una Ofthe principales requisitos para la aplicación de esta serie basada en pyrosequenc- ingapproach iscoveringindividualbeads con múltiples copias del samemolecule. Esto se realiza por primera creatingsequencinglibrariesin que everyindividualmolecule recibe dos differentadaptersequences, uno atthe 50endand uno en el 30final de la molecule.In el caso de la / Roche preparación sequencinglibrary 454 [16], esto se hace bysequentialligation oftwo oligos pre-Synthes-zados. Uno de los adaptadores añadió iscomplementary a oligonucleótidos enel perlas de secuenciación y, por tanto allowsmolecules para ser unido a las perlas byhybridization.Low molécula-a-beadratios y la amplificación de la secuencia de doble cadena hybri- dized en thebeads (keptseparate usando emulsionPCR) hace itpossible para crecer beadswith miles ofcopies OFA singlestartingmolecule.Usingthesecondadapter, perlas cubiertas con moleculescan beseparated de perlas vacías (usando perlas de captura especiales con oligo- nucleótidos complementarios al adaptador sec-ond) y arethen utilizados enla asdescribedabove reacción de secuenciación. La sustitución promedio (excluyendo inserción / deleción, InDel tasa de error) es enel intervalo de 10 "3 -10"4[16, 35], que es higherthantheratesobservedforSangersequencing, butis la sustitución ERRORRATE lowestaverage ofthenew tecnologías de secuenciación discussedhere.As mencionados earlierfor Sangersequencing, in vitro amplificaciones por- formados para la secuenciación preparationcause una tasa de error de fondo superior, es decir., El error introducido en la samplebeforeitentersthesequencer.Inaddition, inbeadpreparation (es decir., PCR en emulsión) una fracción Ofthe beadsend hasta carryingcopiesofmultiple differentsequences.These''mixedbeads '' van a participar en un alto incorporaciones numberof por ciclo de flujo, como resultado-ción en la secuenciación readsthatdo notreflectrealmolecules.Mostofthesereads se filtran automáticamente duringthe software de post- procesamiento del filtrado data.The de granos mixtos puede, cómo-ever , causar un agotamiento de sequenceswith real de una alta fracción ofincorporationsper ciclo de flujo. Alargefractionoftheerrors observadas para este instrumento son smallInDels, en su mayoría derivados de inaccuratecallingofhomopolymerlength, andsingle deleciones de pares de bases o insertionscaused por thresholdingissues señal-ruido [35]. La mayoría de estos problemas Canbe resuelto por una mayor cobertura. Por mucho(>10 nt) homopolímeros, sin embargo, a menudo Thereis una longitud miscall coherente thatis notresolvable por la cobertura [35-37] .Stronglightsignalsin onewellofthe PicoTiterPlate también puede resultininsertions en secuencias en neighboringwells. Si el pozo vecino está vacía, thiscangenerateso-calledghostwells,es decir., Pozos para el cual un signalisrecorded pesar de que contienen plantilla noSequence; por lo tanto, los Inten- sidades medidos son completamente causedby sangrado a lo largo de la señal del vecino-ing wells.Computationalpost-proceso-ción puede corregir estos artefactos [38] .Como para la secuenciación de Sanger, el rateincreaseswiththepositioninthesequence error. En el caso de la secuencia 454, esto es causado por una reducción en enzymeefficiency o pérdida de enzimas (resultingin una reducción de la intensidad de señal), algunas moléculas ya no ser elong-ado y byan increasingphasingeffect.Phasingisobserved cuando apopulation de moléculas de ADN amplifiedfrom thesamestartingmolecule ( ensemble) se secuencia, y describesthe proceso en el que no todas las moléculas intheensembleareextended en everycycle. Esto hace que las moléculas en theensemble perder sincronía / fase, andresultsin un oftheprecedingcycles de eco que se añaden a la señal como el ruido. Thecurrent454 / RocheGSFLX plataforma de titanio hace posible tosequence alrededor de 1,5 millones de tales beadsin un solo experimento y para determinesequences oflength entre 300 and500 nt. La longitud de la lee es deter- minado por el número de ciclos de flujo (thenumberoftimesallfournucleotides se lavan sobre la placa) como wellasby la composición de base y el orden Ofthe bases en la secuencia a disuadir-minadas. Actualmente, 454 / Roche limita thisnumber a 200 ciclos de flujo, lo que resulta Inan longitud averageread esperado ofabout400 nt.Thisislargely debido tolimitationsimposed por los efficiencyofpolymerases y luciferasas, cual cae sobre la carrera de secuenciación, resultingin disminuyó plataformas qualities.Currentlythe base permite about750 secuencia Mb ofDNA que se creará perdaywith costes de unos 20 $ / Mb. Illumina Genome Analyzer II / IIx Thereversibleterminatortechnologyused por el Illumina Genome Analyzer (GA) employsasequencing- por-sin-tesis conceptthatis similarto thatused en Sangersequencing,es decir.theincorporation reacción se detuvo aftereach base, la etiqueta de la base incorp corporado-se lee con tintes fluorescentes, y la reacción de secuenciación es entonces con-continuó con la incorporación ofthenext de base [13, 39] (Fig. 3). Like454 / Roche, theIllumina protocolrequires secuenciación thatthesequences que se determinen son acondicionado verted en una biblioteca de secuenciación especial, lo que les permite ser amplificado andimmobilized para la secuenciación [13, 40]. Forthis propósito dos adaptadores diferentes areadded al 50y 30extremos de todos MOL-ecules utilizando la ligadura de los llamados forkedadapters.1La biblioteca es entonces amplifiedusing secuencias de cebador más largo, cual extendandfurtherdiversifytheadapters para crear la finalsequenceneeded en pasos posteriores. Thisdouble-strandedlibraryis meltedusingsodium hydroxidetoobtainsingle- strandedDNAs, whichare luego se bombea a un muy bajo concen-tración a través de los canales de una célula de flujo. Esta celda de flujo tiene en su superficie twopopulationsofimmobilizedoligonu- cleotidescomplementarytothetwodifferentsingle hebra adapterendsof la secuenciación library.These oligo-nucleotideshybridizetothesingle- 1 Los híbridos de oligonucleo- parcialmente complementaria mareas creando un extremo de doble cadena con un Toverhang, con un de cadena sencilla y un differentsequence en el otro extremo. ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 527 Métodos,ModelosyTécnicas
  • 5. moléculas de la biblioteca varados.por inversa síntesis de la cadena a partir de la parte hybri-dized (de doble cadena), el newstrandbeingcreatediscovalentlybound a la celda de flujo. Si este nuevo strandbends más y se une a otro oli-gonucleotide complementaria a la secuencia adaptador sec-ond en el extremo libre Ofthe hebra, que puede ser utilizado para sintetizar una segunda strand.Thisprocessofbending inverso unido covalentemente y síntesis reversestrand, llamado puente amplifi-cación, se repite severaltimes andcreates grupos de varios 1.000 copiesofthe originalsequence en muy closeproximity de la otra en la celda de flujo [13, 40]. Estos grupos distribuidos al azar contienen moleculesthatrepresenttheforwardaswellasreversestra ndsof las secuencias originales. Antes de disuadir a-la minería de la secuencia, uno de los strandshastoberemovedtopreventitfrom obstaculizando los reactionstericallyorbycomplementarybasepairing.Stra nds de extensión son modificaciones de forma selectiva cleavedatbase ofoligonucleoti-des en el strandremoval cell.Following flujo, cada grupo en los cellconsists flujo deHabitación trenzado, copias identicallyoriented Ofthe misma secuencia; que puede ser secuenciado por hibridación el cebador de secuenciación en los adaptersequences y comenzar la química reversibleterminator. '' '', Solexasequencing asitwas introducedinearly2007, initiallyallowed para la administración simultánea sequenc-ción de varios millones de Sequen-ces muy cortos (nt atmost26) inasingleexperiment.In los últimos años se havebeen severaltechnical, química, andsoftware updates.The producto, whichisnow llama theIlluminaGenomeAnalyzer, ha aumentado clusterdensities celda de flujo (más de 200 millones clus-tersperrun), un widerrangeoftheflow cellisimaged, andsequencereads de hasta 100 nt pueden ser generated.A technicalupdate también permitió thesequencingofthereversestrand ofeach molecule.Thisisachieved bychemicalmelting y lavado awaythe secuencia sintetizada, la repetición de una síntesis de la cadena bridgeamplificationcyclesforreverse pocos, y luego selec-tivelyremovingthestartingstrand (de nuevo usando modificaciones de bases de el celloligonucleotide poblaciones de flujo), beforeannealing anothersequencingprimer para el segundo read.Using this''paired- endsequencing''approach, approximatelytwicetheamountofdata puede haber generated.The Illumina libraryandflowcellpreparationincludes variosin vitro amplificationsteps, lo que causa un alto grado backgrounderror y contribuir a la tasa ofabout10 averageerror"2-10"3[41,42] .Further, theflow fracción cellpreparationcreatesa ofordinary- lookingclustersthatare inició a partir de secuencias de calidad mostlylow uno signalsand individualsequence.Theseresultsin mixta morethan de estos clusters.Similarto the454 ghostwells, theIllumina identifychemistrycrystals imagen analysismay, polvo, andlintparticles como racimos y llaman sequencesfrom these.In tales casos, las resultingsequences típicamente parecen ser de complejidad lowsequence. Como es el caso para las otras plataformas, La tasa de error aumenta con increasingposition en los sequence.This determinada se debe principalmente a la eliminación gradual, proceso de secuenciación whichincreasesthebackgroundnoiseassequencingprogr esses.Whiletheensemble de piro- sequencingcreatesuni-directionalphasing, crea reversible terminador sequenc-ción bi- directionalphasing [41,43] como algunos incorporan también nucleotidesmay fallar a darse por terminada correctamente -permitiendo la extensión de la secuencia por otro nucleótido en el mismo ciclo. Figura 3.Terminator química reversible aplicada por los cebadores Illumina GA.Sequencing se recuecen a los adaptadores de la sequencesto determinar. Las polimerasas se utilizan para ampliar las sequencingprimers por incorporación offluorescently etiquetados y terminatednucleotides.The incorporación se detiene inmediatamente después de The firstnucleotide debido a la terminators.The polymerasesand libre nucleótidos son lavados y la etiqueta de las bases incorporatedfor cada secuencia se lee con cuatro imágenes tomadas a través differentfilters (filtro de nucleótido T se indica en la figura) y el uso de dos láseres diferentes (rojo: A, C y verde: G, T) para iluminar fluorophores.Subsequently, los fluoróforos y terminadores se eliminan yla secuenciación continuó con la incorporación de la base siguiente. M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 528 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 6. Con increasingcyclenumbers, theintensities extraen de la clustersdecline [41, 43, 44]. Esto es debido a fewermolecules que participan en el extensionreaction como resultofnon- reversibletermination, o debido a la atenuación effectsof los fluoróforos de secuenciación. En earlyversions Ofthe química, uno ofthefluorophorescould becomestucktothe grupos que crean otra fuente ofincreased ruido de fondo [41]. la simultaneousidentificationoffourdifferentnucleot ides es también un cuestión.La GA utiliza fourfluorescentdyes todistinguish los fournucleotides A, C, G, y T.Of estos, dos pares (A / C y G / T) excitado usando el mismo láser, son similarin theiremission espectros andshow única separación limitado el uso de filtros Opti-cal. Por lo tanto, las mayores errores substi-tución son observadas entre A / Cy G / T [41, 42]. A pesar de que el Illumina GA lee mostrar ahigheraverageerrorrate, un errorrange wideraverage, y areconsiderablyshorterthan 454 / Rochereads, el GA instrumentdeterminesmore de 5.000 Mb / día con un priceofabout0.50 $ / Mb.This es más thansix veces mayor rendimiento diario y foraconsiderablylowerpricepermegabase. Applied Biosystems SóLIdAS Theprototypeofwhatwasfurtherdevelopedandlatersol dbyLifeTechnologies / Applied Biosystems (ABI) como la plataforma de secuenciación sólida, wasdeveloped por Harvard MedicalSchoolandtheHowardHughesMedicalInstitute y publicados en 2005 [17] .Con itscommercialreleasein finales 2007, sólido fue sólo el tercer newhigh- throughputsystem mercado enteringahighly competitiva con todo threevendorsselling theirinstrumentsforaroundhalfamilliondollars.TheChu rch laboratorio de la Universidad de Harvard MedicalSchoolcontinuedthedevelopmentofthesystem andnow offersacheaper (<$ 200.000) SourceVersion abierta Ofthe sistema (llamado Polonator) en colab- oración con el sistema de Dover. En el thirdquarter de 2008, un com-biotecnología empresa de Mountain View, California, namedCompleteGenomicsstartedoffering una tecnología genoma humano sequencingservice.Their se basa también ontheChurchlabsequencing por ligadura de concepto, pero itwitha combina nueva estrategia libraryconstruction ofsequencing y la secuencia immobiliz-ación utilizando círculo amplificación de laminación [45]. Aquí, nos centramos en el sistema commercialSOLiD ya que esta es la aplicación más extendida de este concepto. Theprinciplebehind sequencing- por la ligadura isvery differentFrom theapproachesdiscussedthusfar.Thesequence reacción de extensión no es coche-Ried polimerasas outby butrather byligases [17] (véase la Figura 4 para un schematicrepresentation Ofthe plat-forma sólida 2/3) .Inthesequencing por ligationprocess, es un cebador de secuenciación hybri-dized de copias de una sola hebra de el moléculas de la biblioteca para ser sequenced.Amixture sondas OF8-mer que llevan fourdistinctfluorescentlabels compiten forligation al cebador de secuenciación. la codificación fluoróforo, que es BasedOn los dos 30-mostnucleotides oftheprobe, se ofrecen las bases read.Three incluidoel tinte se escinden del 5 0 final de la sonda, dejando una libre 50 fosfato de la extendida (por cinco nucleótidos) pri-mer, que a su vez está disponible para furtherligation.After múltiples ligaduras (typi-camente hasta 10 ciclos), el synthesizedstrandsaremelted y theligationproductis arrastrado ante un newsequencingprimer (shiftedbyonenucleotide) se annealed.Starting fromthe nueva secuenciación el cebador ligationreaction se repite. El mismo proceso isfollowed para otros tres cebadores, facili-litar la lectura de la dinucleotideencoding para cada posición de inicio en thesequence.Usingspecificfluorescentlabelencoding, el colorante salidas leídas (es decir.colors) se puede convertir en una secuencia [46]. Esta conversión de tosequence espacio de color requiere un firstbase conocido, que es la última base de la libraryadaptersequence.Given utilizado un referencesequence, esto allowsdetection sistema de codificación ofmachineerrorsand theapplication ofan errorcorrection toreduce la theabsence promedio errorrate.In de una secuencia de referencia, la forma de la historia, color la conversión falla con un errorin el tinte leer outand causesthesequence aguas abajo Ofthe errortobe incorrecta. Para la paralelización, la secuenciación copias processusesbeadscoveredwithmultiple Ofthe secuencia para bedetermined. Estas perlas se crean en de una manera similar a la descrita oído-lier para la plataforma 454 / Roche. En contraste con-a la tecnología 454 / Roche, el sólido sistema hace un Nouse forfixation PicoTiterPlate Ofthe granos en proceso de thesequencing; en lugar de la 3 0 extremos de las secuencias en las perlas se modi-ficado de manera thatallows obligado a becovalently en un glassslide.As para el sistema de Illumina GA, este cre- ates una dispersión aleatoria de las cuentas enla cámara de secuenciación y permite densidades de carga forhigher. Sin embargo dispersión, Ran-dom complica la identi-ficación de las posiciones de cuentas de las imágenes, y da lugar a la posibilidad de que los cristales químico-cal, polvo y partículas de pelusa canbe identificado erróneamente asclusters.Further, la dispersión de los resultados de los granos en una distancias widerangeofinter-grano , whichthen tienen diferente susceptibilidad a beinfluenced por señales de neighboringbeads. Tipos y causas de los errores de secuencia son diversos: primero, la in vitro pasos amplifica-ción causan un mayor backgrounderror rate.Secondly, perlas que llevan amixture de secuencias y los granos en closeproximity a falsereads uno anothercreate y baja bases.Further calidad, disminución de la señal, una pequeña phasingeffect regular, andincompletedyeremovalresult en el aumento de error como el ligationcyclesprogress [47] .Phasing, asdescribed anteriormente, es una plataforma de minorissue onthis como secuencias no extendedin el último ciclo son no reversible ter- minatedusingphosphatases.Sincehybridization proceso estocástico isa, esto provoca una reducción considerable enel número ofmolecules participatingin subsequentligation reacciones, andthereforesubstantialsignaldecline.On Por otro lado, dado el efficiencyof fosfatasas la phasingeffectcanbeconsideredverylow.However restante, ofthedyes de escisión incompletas pueden permitir la escisión en la reacción nextligation, que luego allowsfor la extensión en el nextbutonecycle.This causa una additionalnoise differentphasingeffectand de colorantes de theprevious de ciclo en el proceso de identi-ficación colorante. El sólido sistema permite en la actualidad ofmore secuenciación de 300 millionbeads en paralelo, con un typicalreadlength de entre 25 y 75 nt. En el momento de escribir, el sólido sistema ABI istherefore comparable a la Illumina GA ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 529 Métodos,ModelosyTécnicas
  • 7. sistema en términos de rendimiento y pricepermillionnucleotides (#5,000 Mb / día,#0,50 $ / Mb) .Average errorratesare, sin embargo, que dependen del genoma de referencia OFA-vano capacidad para errorcorrection (10 "3 -10"4vs. 10"2-10"3). En theabsenceofa referencegenome, montaje y consensuscalling El procedimiento puede realizarse sobre la base de tinte leer outs (los llamados colorspacesequences) toreduce los errores antes de la conversión enel secuencia de nucleótidos. Si hay referencegenome está disponible para la corrección de errores, y no hay consenso callingis montaje y realiza, a continuación, el error medio rateis superior a la de la Illumina GA. Helicos HeliScope Helicos es la firstcompany a sellasequencer capaz de secuenciar individualmolecules en lugar ofmolecule ENSEM-bles creados por una amplificación proc-ess. la secuenciación de una sola molécula tiene bybiases theadvantagethatitisnotaffected o errores introducidos en un paso librarypreparation o amplificación, y puede facilitar ofminimalamounts de secuenciación de entrada DNA.Using methodsable para detectar los nucleótidos no estándar, sino que también podría tener en cuenta las modificaciones del ADN identificationof, perdió comúnmente enel in vitro proceso de amplificación. El HeliScope, como el sequenceris Helicos llamada, se vendió por primera vez en marzo de 2008, y para el final Ofthe firstquarter of2009 única fourmachineshavebeeninstalled en todo el mundo. Esto podría ser sur la extracción con palanca dadas las ventajas de soltero moleculesequencing, butprobablyreflects tanto las limitaciones específicas ofthisplatform, theprice (dólares aboutonemillion), y un relativamente smallmarket que ya ha invertido exten-vamente en las nuevas tecnologías de secuenciación. Thetechnologyapplied (figura 5) que podría denominarse virtualterminatorchemistry asíncrono [15] .InputDNAisfragmentedandmeltedbefore una Figura 4.secuenciación de Solid Applied Biosystems por imprimación ligation.Asequencing se hibrida con las copias de una sola hebra de Sequen-ces que se determinen. Octamer sondas se hibridan, se ligan a thesequencing cebador, y un tinte fluorescente en el 5 0 final del ligado 8-mer sondas, la codificación de los dos 30 nucleótidos -la mayoría de la sonda, es leer dephosphorylated.Threenucleotides primersare extendidos-out.Non de la sonda que incluye el colorante se escinden, creando un libre 50fosfato para más ligaduras múltiples ligations.After, hebras thesynthesized se funde y el producto de ligación es washedaway antes de una nueva, nucleótidos desplazada por un cebador de secuenciación isannealed.Starting de la nueva ligationreaction secuenciación primerthe se repeated.The mismo se hace forthree otherprimers , lo que permite la lectura de la etiqueta dinucleótido para cada posición en la secuencia. M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 530 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 8. poli-A-tailissynthesized molécula ontoeachsingle hebra usando una polimerasa poli-ciclasa. En la última etapa ofpolyadenylation, se añade un labeledadenine con fluorescencia. La biblioteca es washedover un flujo cellwhere poli-A tailsbind a poli-T oligonucleotides.Thebound coordenadas en la celda de flujo aredetermined utilizando una fluorescencia de basedread fuera del flujo thesecoordinates cell.Having detectadas, la fluorescentlabel de la 30adenina se elimina andthesequencingreactionstarted.Polymerasesare lavó a través de theflow célula con un tipo de nucleótido fluorescentlylabeled (A, C, G, o T) en atime y las polimerasas se extienden thereverse hebra de las secuencias startingfrom la incorporación de poli-T oligonucleotides.Thenucleotide Ofthe poli-merases se ralentiza por el etiquetado fluor-escent y permite como máximo una constitución antes de polímero-asa se elimina por lavado junto con los nucleótidos Thenon- Incorporated (termedvirtualtermination [48,49]). El flowcellisthen fotografiado de nuevo, los tintes Fluor- escent se eliminan, y la reac-ción continuó con otra nucleotide.By este molécula proceso notevery isextended en cada ciclo, que es whyit es una secuenciación proc-ess asíncrono que resulta en secuencias ofdifferentlength (como es el caso para el 454 / Rocheplatform). Ya que soltero moleculesare secuenciado, siendo débil measuredare las señales, y no hay posibilidad thatmisincorporationerrorscan Becor-rected por un conjunto effect.Due enel hecho de que las moléculas se unen enel celda de flujo sólo por hibridación, thereis la posibilidad de que las moléculas plantilla canbe pierden en el lavado steps.In adición, moleculesmay beirreversibly termi-nado por la incorporación de nucleótidos incorrectlysynthesized. En general, se lee tienen entre 24 y 70 nt de longitud (nt average32) [50] y por lo tanto más corto que para theother plataformas. Debido a la mayor num-ber de secuencias determinadas en paralelo, el rendimiento total por día (4150 Mb / daywith un coste de #0,33 $ / Mb [50]) está en thesame rango que forthe GA y SOLiDsystems.The tasa de error promedio, whichisin la gama OFA pequeño tanto por ciento, isslightly superior a la de todos los demás instru- mentos y sesgada hacia Indeles sustituciones mas bien que. Aplicaciones y generalconsiderations Allcurrenthigh-throughputtechnol-gías tienen un error medio tasa que Figura 5.la química virtualterminator asíncrono realizado byThe ADN HeliScope.Input se fragmenta, se derritió, y RELAClONADAS-polyadeny. Un adenina marcado con fluorescencia se añade en el último paso. Thissingle de hebra de ADN se lava a través de una celda de flujo con poli-T oligo- nucleótidos que permiten la hibridación. Las coordenadas consolidados sobre la cellare flujo determina utilizando el marcado con fluorescencia adenines.Having las coordenadas identificadas, el fluorescentlabelofthe 30adeninas se removed.Polymerases se lavan a través con una escriba nucleótidos de la etiqueta fluorescente (A, C, G y T) a la vez, y las polimerasas se extienden la cadena inversa de las secuencias de a partir de los oligonucleótidos de poli-T. El nucleótido Incorpora-ción de las polimerasas se ralentiza por la labelingand fluorescente permite a lo sumo una incorporación antes de la polimerasa iswashed away.The Cellis flujo entonces fotografiado, la fluorescentdyesremoved, y la reacción continuó con otro nucleótido. ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 531 Métodos,ModelosyTécnicas
  • 9. es considerablemente más alto que el / 10,000to1 / 100,000observedforhigh calidad typical1 Sanger secuencias. Además, theGSFLX titanio, GA, y plataformas HeliScope SOLiD eachhave Limita-ciones biasesand muy específicas, por lo que es necesario escoger aplatform apropiado para una aplicación específica proyec-ector (para un resumen verTabla 1). Una combinación de tecnologías [51-54] y protocolos experimentales [55-57] También puede ser apropiado, y evencomplementary, para proyectos específicos. De alto qualitySangersequencing isnow commonlyused a generatelow-cobertura de la secuenciación de individualpositions y regiones (p.ej., Diagnosticgenotyping) genomes.AstheSangersequencelengthislongerthanmo stabundantshortrepeat clases enteras y orthesequencingofvirus--fago de tamaño, que permite a los unambigu-ousassemblyofmostgenomicregions - algo thatis generallynotpossibleusing theshorterreadplatforms.However, la tecnología y isexpensive demasiado lento para las muestras sequencinglarge, extendidos genómicos re-regiones, o las muchas moléculas requiredforquantitativeapplications [p.ej., La expresión génica cuantificación; cro-Matin inmunoprecipitación sequenc-ing (chip-ss.), Andmethylation dependiente de inmunoprecipitación Sequen-cing (MeDIP-Sec)] termsofsequencenumberandhastheadvantage ForquantitativeapplicationstheHeliScopeprovidesthehi ghestthroughputin de no requerir un protocolo de preparación multisteplibrary. En el AT-herhand, el HeliScope ofrece thelowest resolución en la cartografía accuracyfor genomas complejos debido a su corta readlength y errorprofile.TheGA orSOLiD resultados cuantitativos para platformsmaythusprovideequivalent dantes-cationes, mientras que proporciona menos pero lon- gerreadsandrequiringamoreelaborate preparación biblioteca. A pesar de que aún no ha sido totalmente analógica lyzed, es posible (e incluso probable) thatlibrary protocolos de preparación podrían biasthe representación secuencia en una muestra [42, 58, 59], por lo que la sustitución ofthisstep un importantgoal.Further, de múltiples etapas biblioteca preparación protocolsrequirehigheramountsofinputmaterial, limitando theirgeneralappli-cation.However, protocolsforlibraryconstructionfromlimitedsample cantidades están disponibles orbeing desa-desa- para cada una de las plataformas, y Pub-publica- demuestran que, si bien vendorprotocols indican la necesidad forhighersamplequantities (rango microgramos), muchos usuarios están procediendo cantidades de ADN de entrada successfullywith bajas (nanogramto rango de picogramos), como, por ejemplo, , las muestras de ADN fromancient [60-62]. Al igual que la secuenciación de Sanger, el GS FLX El titanio proporciona una longitud de leer lapso de Ning muchas de las secuencias repetidas cortas - Un assemblyofgenomes importantfeatureforaccuratesequencemappingand [63] .A pesar de los errores indel, esta tecnología tiene índices muy bajos ofmisidentifying bases individuales, makingit perfectamente adecuado para los identificationofsinglenucleotidepolymorphisms (SNP). También dirigido a los identificationofSNPs, atleastfor muestras con anexistingreferencegenome, instrumento istheSOLiD con su dinucleotideencodingscheme [46] .Considerablyhighercoverage se necesita para llamar performSNP con una precisión similar usingtheIlluminaGA [64] .NeithertheIllumina GA ni los sistemas sequenc-ing SOLiD ABI son propensos a generar highrates de indeles pequeñas, haciéndolos wellsuited para el estudio de la variación InDel. Como se mencionó anteriormente, el inconveniente ofshortreads (por debajo de about75 nt) obtenidos a partir de Helicos, sólido, orGAinstrumentsisin genomeassemblyand aplicaciones de mapas, donde theplacementofrepeated orvery similarsequences no se pueden resolver UNAMBIG-nuamente. La colocación correcta se furthercomplicated por altas tasas de error intro-ducing una distancia requirementfora minimumsequence ofan unambiguousplacement. -Extremo emparejado o de yerba mate de par ayuda a favor de los protocolos para superar algunos de theselimitations de corta lee [65] por la información Provid-ción acerca de la orientación relativa locationand ofapairofreads.Currently un protocolo de extremo emparejado se aplica onlycommonly en el GA, whilemate-pairprotocolsareavailableforSOLiD, GS FLX Titanium, y GA.Inpaired de fin de secuenciar el real extremos moléculas de ADN de más bien cortas (<1 kb) aredetermined, whilemate-pairsequencing requiere la preparación deOferta bibliotecas. En estos protocolos, theends de moléculas más largas, tamaño seleccionado (p.ej., 8, 12, o 20 kb) están conectados withan secuencia adaptador interno en un circu- larizationreaction.Thecircular molécula se procesa a continuación, utilizando enzimas restric-ción orfragmentation beforeouter adaptadores biblioteca se añaden dos extremos del aroundthe molécula combinada. la adaptador interno se puede entonces utilizar como moléculas additionalsequencingreactiononthesameimmobilized una segunda sitio de cebado FORAN. Por lo tanto, compañero-pairsequencingprovidesdistanceinfor- mación usefulforassembly, butdoesnot permitir la fusión de los dos se superpone a finales lee, ya que por themolecules de diseño no se solaparán en sequenc-ing.However, la fusión de los dos se superponen-ping avance y retroceso endreads pareadas de corto inserto bibliotecas allowsthe reconstrucción OFA completa con- secutivemoleculesequence, longerthan la longitud individualread, ycon las tasas de error promedio de reducción en theoverlapping secuencia de parte [60, 66]. Debido a las grandes cantidades de secuencial ces creadas, hay interés en regiones seleccionadas sequenc-ing (p.ej.agenomiclocus, desde sequencecaptureexper-iments [67-69]) en múltiples individuos / samplesinsteadofsequencingonesamplein excessivedepth.Alltech-gías, por tanto, proporcionan una placa separationoftheirsequencing en definedregions o channels.However, como máximo, 16 tales regiones / canales están disponibles (GS FLX Titanium y placas HeliScope), que, no tengan el sufficientforsomeapplications. El uso de diferentes bibliotecas con-structionprotocols, además someplatformsallow de muestra de código de barras específico (a veces llamado '' index '') secuencias enel molecules.These biblioteca moleculescan entonces besequenced en thesameregion / canal, andlaterseparated (computacionalmente) theirbar basa en la secuencia de código [70-73 ]. esto facilita altamente parallelsequencing LargeNumber OFA de las muestras más allá de que los possibleusing (protocolos mostlynon proveedores) physicallane / channelsepar-ation.Currently tales protocolos disponibles forthe GS FLX Titanium, GA, y SOLiDinstrument. Aunque los precios de secuenciación por giga- de base han disminuido considerablemente en los últimos años a, haciendo Proyecto Genoma projectslikethe1000Human Variación, 1001Arabidopsis thaliana Proyecto genomas, theMammalianGenomeProject, ortheInternationalCancerGenomeConsortium posible, de alta throughputsequencing adquisición stillhashigh, el funcionamiento y los costes de mantenimiento, cual M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 532 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 10. no se incluyen en la Tabla 1. Además, eachof estas plataformas requiere una managementandanalysis datos substantialinvestmentin, tiempo y personal [74- 77] grupos de investigación .Smaller todavía puede encontrar prohibitivos los costos de la infrastructureneeded para almacenar, manipular y ana-lizarla severaltens de gigabytes de datos y terabytes de puresequence varios miles de archivos intermedios generados instrumentos bythese cada semana. Incluso para mayores, centros de genoma experimentados thisaspect sigue siendo una cada vez mayores Chal- lengefortheongoinguseoftheseplatforms. próximas promociones Motivado bythegoalofa $ 1.000 genoma Fijado por el NIH / NHGRIto enablepersonalized la medicina, los throughputofallsystems descrito es constante y el aumento de los números dados herearerapidlyoutdated.However, inaddition a las mejoras de currenttechnologies, includingtheJanuary2010 announcementoftheIlluminaHiSeq sistema de 2000, que determinessequences de clusters en el fondo y topof la celda de flujo y procesa dos celdas de flujo en paralelo, una nueva generación ofsequencers ya está en el horizonte. WhatstartedwiththeHelicos sistema - la secuencia de un solo mol-ecules sin amplificación previa preparationor biblioteca - probablemente se convierta en apopular paradigma. En concreto, tres OT-sus sistemas han captado la atención de medios andscientific WELLIN avance oftheir real Disponibilidad: Pacific nanoporos Bioscience'sSingleMoleculeRealTime (SMRT) sequencingtechnology [18], BASE-Technol gía de Oxford nanoporos [14] y, recientemente, la propuesta de IBM-ofsilicon basa [78]. PacificBiosciences'SMRT technologyperformsthe reacción de secuenciación onsilicon dióxido de chipswith un 100 nmmetalfilm containingthousandsoftens-de- nanometerdiameterholes, los llamados guías de onda en modo cero (ZMWs) [79]. Cada ZMW se utiliza como una cámara de nano-visual-ización, proporcionando un detectionvolume de 20 zeptoliters (10 "21 l). en este volumen, una sola molécula puede ser illu-minated excluyendo otros labelednucleotides en el fondo - savingtime y química de secuenciación por omitir- ting etapas de lavado. Un ADN único polímero-asa está fijada a la parte inferior de la surfacewithinthedetectionvolume, andnucleotides, con differentdyes unido a la cadena de fosfato, areusedinconcentrationsallowingnormal procesividad de la enzima. Como las pol- ymeraseincorporatescomplementarynucleotides, thenucleotideisheldwithin Fortens volumen de detección Tabla 1. Comparación de las tecnologías de secuenciación de alto rendimiento disponibles rendimiento Longitud Calidad costos aplicaciones Las principales fuentes de errores La tabla resume el rendimiento, la duración, la calidad y los costes para las versiones actuales de las tecnologías mencionadas. estos aproximada los números están en constante mejora y en base a las cifras disponibles en enero de 2010. Los costos hacen instrumentacquisition notinclude y mantenimiento; aún pueden verse afectados por los descuentos y los efectos de escala para múltiples instrumentos. Cuando los números son muy similares, colorsranging de rojo rendimiento) a verde (buen rendimiento) indican una tendencia general. En la última columna, aplicaciones de ejemplo perfiles de error de ajuste thethroughputand ofeach Ofthe plataformas son given.Typically, esto hace notmean thatthe tecnología se limita a theseapplications, pero que actualmente es el más adecuado para este tipo de aplicaciones. þ Alta profundidad secuenciación / número de pasadas requeridas. ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 533 Métodos,ModelosyTécnicas
  • 11. ofmilliseconds, ordersofmagnitudelongerthan forunspecificdiffusionevents. De esta manera el tinte fluorescente oftheincorporatednucleotidecanbeidentified durante la síntesis normal de reversestrand velocidad [79] .En pilotexper-iments, Pacific Biosciences tiene shownthatitstechnology allowsfordirectsequencing OFA pocos miles basesbeforethepolymeraseisdenatureddue a la lectura láser outofthe tecnología dyes.The SMRT está destinado forrelease en 2010.Even aunque se necesita furtherdevelopment para crear un morerobustsystem, la omisión oflibrarypreparation y amplificación así como seguir las secuencias largas generadas willundoubtedlyprovideanadvantageoverthecurrentsy stemsformanyapplications. BASE tecnología de Oxford nanoporos es poco probable que sea lanzado pronto como modificaciones astheSMRTtechnology.BASEoffersthepotentialtoi dentifyindividualnucleotide (p.ej. 5-metil- citosinavs.cytosine) proceso duringthesequencing [14]. La idea behindthis tecnología es la ofindividualnucleotides de identificación utilizando un changein el potencial de membrana, ya que de paso a través de una modificación una-hemolisina de poro mem-brana con un sensor de ciclodextrina [14, 80]. Sin embargo, la aplicación de este Technol-logía para la secuenciación, el poro tiene que befused a una exonucleasa, que degradessingle- strandedDNAsequencesandreleases individualnucleotides en thepore. Además, la tecnología needsto ser paralelizado en formato de matriz, beforeits liberación como un alto rendimiento sequenc-ción platform.While la sensibilidad forindividualnucleotidemodificationsseemsto ser un majoradvantage, thedestructivefashionoftheoutlinedsequencing proceso podría ser forApplications considereda obstáculo con muestras de pre-preciosas, y que no permite una segunda ciclo de lectura para la reducción de error. A principios de octubre de 2009, IBM emitió una Comunicado de prensa [78] describe un método toslow la velocidad ofan individualDNA cadena que pasa a través de un nano-pore.For este fin developeda de múltiples capas de metal / dieléctrico nanoporedevice que utiliza la interacción de cargas theDNA columna vertebral con un campo eléctrico RELAClONADAS-modu para atrapar y slowlyreleases una tecnología individualDNA molecule.The descrito podría Theor- éticamente combinarse con, por ejemplo, las tecnologías desarrolladas Nanopore atHarvard Universidad [81] o la base previouslydescribed technologywhereitmay superar la destructiva approachfollowed hasta ahora. Conclusión Currenthigh-throughputsequencingtechnologies proporcionan una gran variedad ofsequencingapplicationstomanyresearchersandproje cts.Giventheimmense la diversidad, hemos notdis- terco estas aplicaciones en profundidad aquí, otras opiniones con unas fuertes aplicaciones onspecific focales y analysisare datos disponibles [24, 82-88]. Los discussedtechnologies hacen posible que evensingle grupos de investigación para generar largeamounts de muy rapidlyand atsubstantially lowercosts thantraditionalSangersequencing.Whilecosts se han reducido a menos than4-0.1% y el tiempo ha sido un factor de shortenedby 100-1.000 sobre la base de datos de secuencias, dailythroughput theerrorprofilesandlimitations observados para el plat nuevas formas de differsignificantly Sangersequencing y entre approaches.Further, cada uno de estos nuevos sequencingplatforms requiere additionalinvestments sustanciales - factores thathave oftennot hacer hincapié suficiente en researchpublications que describe una específica apli- cation.Somevendorshaverecentlystarted para ofrecer versiones de presupuesto de theirinstruments (p.ej. Illumina GA IIe o 454 / Roche GS Junior) con sequencingcapacity.However menor, precio whiletheinstru-ment es más bajo, la financiera invertirá-ment permanece high.Costs por base aregenerally superior a la de la standardinstrument, y verysimilaroverallinfrastructureisstillrequired.Oftenthe elección de una adecuada sequencingplatform es projectspecific y algunos timescombinationscanbeadvan-- tageous.Thismayopen themarketfurtherto companiesproviding secuenciación-en-demandservices, butwill no reemplaza la necesidad de laboratoriesto invertir un tiempo considerable y exper-Tise tanto en la producción de análisis librariesand Ofthe vastquantities ofdata que se generará. Las nuevas tecnologías en el horizonte, SMRT por Pacific Biosciences, BASE byOxford nanoporos, y othertechnol-gías como thatsuggested por IBM, demostrar el futuro importante directionsin el campo de la secuenciación de ADN: el Abil-dad de usar moléculas individuales withoutany preparación biblioteca o la amplificación, la identificación de nucleotidemodifications específicos, y la capacidad de gener comió-secuencia más larga lee. Estos debuta de desa- facilitarán futuras investigaciones inmany campos, hacer más fácil el análisis de datos, y los costos de secuenciación furtherreduce, hopefullyachievingtheaim OFA $ 1.000 genoma humano sugiere byNIH / NHGRI que se requiere para la medicina-zado personal. Expresiones de gratitud Agradecemos a los miembros Ofthe Salida- mentofEvolutionaryGenetics, los miembros de la andparticularly sequencingGroup, forproviding datafrommultipleplatforms de secuenciación, aswellasinteresting usefulinsights.We discussionsand también están en deuda con A.Wilkinsandthethreeanonymousreviewersforcriticalr eadingofthemanuscriptand thoughtfulcomments.This trabajo fue apoyado por la Sociedad Max Planck. referencias 1.Sanger F,GM aire,BarrellBG,et.1977.Nucleotide secuencia de ADN ofbacteriophage phiX174. Naturaleza 265: 687-95. 2.Gilbert W,Maxam A.nucleotidesequence 1973.The del operador lac. Proc Natl AcadSciUSA 70: 3581-4. 3.SangerF,Nicklen S,Coulson AR.1977.DNAsequencingwithchain- terminatinginhibitors.ProcNatlAcadSciUSA 74: 5463-7. 4.Sanger F, Coulson AR. 1975. Una rápida methodfor determinar las secuencias en el ADN por primedsynthesis con ADN polimerasa. J Mol Biol 94: 441-8. 5.Wu R, Kaiser AD. 1968. Estructura y basesequence en los extremos cohesivos de ADN lambda-fago ofbacterio. J MOLBIOL35: 523-37. 6.Smith LM,Sanders JZ,KaiserRJ,et. detección 1986.Fluorescence en análisis de la secuencia automatedDNA. Naturaleza 321: 674-9. 7.Swerdlow H,Gesteland R.1990.Capillarygelelectrophoresis para la secuenciación rápida resolutionDNA, alta.NucleicAcidsRes18: 1415-9. 8.Zagursky RJ,McCormick RM.1990.DNAsequencing separaciones en geles capilares en amodified instrumento de secuenciación de ADN comercial ambiente. Biotechniques 9: 74-9. 9.Huang XC, Quesada MA, Mathies RA. 1992.DNA secuenciación capilar usando matriz electro-foresis. AnalChem 64: 2149-54. 10.Kambara H,TakahashiS.analizador de capillaryarrayDNA 1993.Multiple-sheathflow. Naturaleza 361: 565-6. M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 534 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas
  • 12. 11.Ueno K,Yeung ES.fragmentos 1994.Simultaneousmonitoring ofDNA separados por electroforesis en una matriz de multiplexado de 100capillaries. AnalChem 66: 1424-1431. 12.kimś,YooHJ,HahnJH.1996.Postelectrophoresiscapillary exploración secuenciación método forDNA.AnalChem68: 936-9. 13.Bentley DR, balasubramanian S, SwerdlowHP,et.2008.Accuratewholehuman la secuenciación del genoma usando la química termin ator reversible. Naturaleza 456: 53-9. 14.Clarke J, Wu HC, Jayasinghe L, et al. identificación de la base 2009.Continuous para single-mol eculenanoporeDNAsequencing.NatNanotechnol4: 265-70. 15.Harris TD,Buzby PR,Babcock H,et. La secuenciación del ADN de una sola molécula de 2008. de aviralgenome. ciencia 320: 106-9. dieciséis.Margulies M, Egholm M, WE Altman, et al. 2005. La secuenciación del genoma en microfabricatedhigh densidad picolitros reactores.Naturaleza 437: 376-80. 17.Shendure J, Porreca GJ, REPPAS NB, et al. 2005. Accurate multiplex polony sequencingof un genoma bacteriano evolucionado. ciencia 309: 1728-1732. 18.Korlach J, marcas PJ, Cicero RL, et al. pasivación de aluminio para 2008.Selective dirigida inmovilización de ADN polimerasa MOL-ecules individuales en cero en modo de guía de ondas nanostruc-turas. Proc NatlAcad SciUSA 105: 1176-1181. 19.Ansorge WJ.2009.Next generación, técnicas de Secuenciación del ADN.NatBiotechnol25: 195-203. 20.MardisER.2008.Next generación, métodos Secuenciación del ADN.Annu Rev Genómica Hum Genet 9: 387-402. 21.Schuster CAROLINA DEL SUR.2008.Next generación secuenciación transforma la biología de hoy.NatMethods 5: 16-8. 22.Shendure J,JIH.2008.Next generación, la secuenciación del ADN.NatBiotechnol26: 1135- 45. 23.Shendure JA,Porreca GJ, Iglesia GM. 2008.Overview ofDNA secuenciación Strat-tegias.Curr protoc MOLBIOLCapítulo 7: Unidad 7.1. 24.Metzker ML. 2010. Las tecnologías de secuenciación - la próxima generación. Nat Rev Genet 11: 31- 46. 25.George KS, Zhao X, Gallahan D, et al. 1997.Capillaryelectrophoresismethodologyfor identificación de genes relacionados con el cáncer patrones expre-sión de reacción en cadena de displaypolymerase diferencial fluorescente.J Chromatogr BBiomed SciAppl695: 93-102. 26.BlazejRG,P Kumaresan,MathiesRA. 2006.Microfabricated bioprocessor para inte-rallado nanolitros escala de ADN Sanger sequenc-ción. Proc NatlAcad SciUSA 103: 7240-5. 27.Mariella R Jr. 2008. Preparación de la muestra: theweak eslabón de bio-detección basada en la microfluídica. Microdispositivos Biomed 10: 777-84. 28.Roper MG,Easley CJ,Legendre LA,et al. 2007. sistema de control de temperatura por infrarrojos fora chainreaction completamente noncontactpolymerase en chips de microfluidos.AnalChem79: 1294-1300. 29.Emrich CA, Tian H, Medintz IL, et al. 2002.Microfabricated 384 carriles conjunto de capilares elec- Bioanalyzer trophoresis para el análisis de ultra-alta-a través putgenetic.AnalChem 74: 5076- 83. 30.Shibata K,Itoh M,Aizawa K,et.2000.RIKEN Análisis de la secuencia integrada (RISA) sistema - 384 formato de la tubería con la secuenciación 384 secuenciador multicapilar.Genome Res10: 1757- 1771. 31.HertDG,Fredlake CP,Barron AE.2008.Advantages y limitaciones ofnext-generación tecnologías de secuenciación ación: a comparisonofelectrophoresis y no electrophoresismethods. electroforesis 29: 4618-26. 32.Ewing B,Hillier L,WendlMC,et.1998.Base Insultos de trazas secuenciador automático usingphred.I.Accuracyassessment.Genome Res 8: 175-85. 33.Ewing B,P. Verde1998.Base-llamando sequencertraces ofautomated utilizando Phred. II.Errorprobabilities.GenomeRes8: 186-94. 34.RonaghiM,Karamohamed S,Pettersson segundo,etTiempo de liberación .1996.Real ofpyrophosphate detección sequencingusing ADN.AnalBiochem 242: 84-9. 35.Quinlan AR,StewartDA,Stromberg MP,et.2008.Pyrobayes: Una base mejorada descubrimiento callerforSNP en pyrosequences.Métodos Nat 5: 179-81. 36.T mimbre, E Schlagenhauf, Un Graner, et al. 2006. 454 secuenciación puso a prueba utilizando thecomplex genoma de la cebada. BMC Genomics 7: 275. 37.RE verde, Malaspina AS, Krause J, et al. 2008. Una completa Neandertalmitochondrialgenomesequencedetermined byhigh-throughputsequencing.Celda134: 416- 26. 38.RE verde,Krause J,Ptak SE,et.2006.Analysisofonemillionbasepairsof NeanderthalDNA. Naturaleza 444: 330-6. 39.TurcattiG,Un romieu,Fedurco M,et. 2008. Una nueva clase fluorescentnucleotides ofcleavable: síntesis y optimización de síntesis terminadores asreversible sequencingby forDNA. Nucleic Acids Res 36: E25. 40.Fedurco M,Un romieu,Williams S,et. 2006.BTA, un novelreagent para el ADN adjuntar-menton vidrio y colonias de ADN amplificados efficientgeneration fase ofsolid. NucleicAcids Res 34: E22. 41.KircherM,StenzelU,KelsoJ.aprendizaje automático 2009.ImprovedbasecallingfortheIlluminaGenome Analyzerusing estrategias. Biol genoma10: R83. 42.Dohm JC, Lottaz C, Borodina T, et al. 2008.Substantialbiases de datos ultra-shortread establece a partir de la secuenciación de ADN de alto rendimiento.Nucleic Acids Res 36: E105. 43.Y Erlich,Mitra PP,delaBastide M,et. 2008.Alta-cíclica: la secuenciación Aself- optimizingbasecallerfornext generación.NatMethods 5: 679-82. 44.RougemontJ,Un Amzallag,IseliC,et. 2008.Probabilistic base de datos llamando ofSolexasequencing. BMC Bioinf. 9: 431. 45.R Drmanac,Sparks AB,Callow MJ,et. 2010.Humangenomesequencingusingunchained readson base de nanoarrays auto-assemblingDNA. ciencia 327: 78-81. 46.Applied Biosystems. UN Teórico Comprensión de2 Base colorcodes andits Aplicación a Anotación, error Detección, andErrorCorrection.WhitePaper SóLIdASTMSistema; 2008. 47.Dimalanta ET,Zhang L,Hendrickson CL,et.2009.Increased Leer longitud en el SólidoTMSequencingPlatform.PosterSOLiDTMSistema. 48.ZhuZ,WaggonerAS.1997.Molecularmechanism el control de la incorporación de fluorescentnucleotides en el ADN por PCR.citometría 28: 206-11. 49.Bowers J,MitchellJ,cerveza E,et.2009.Virtualterminatornucleotidesfornext- la secuenciación del ADN generación.NatMethods6: 593-5. 50.Pushkarev D,NeffNF,SR terremoto.2009.Single secuenciación de moléculas individuales ofan Genoma humano. Nat Biotechnol 27: 847-52. 51.Reinhardt JA,Baltrus DA,Nishimura MT,et al. conjunto de 2009. De novo usando bajo tura tura datos de la secuencia corta leídos del ricepathogen Pseudomonas syringae pv. oryzae.Genome Res 19: 294- 305. 52.DiguistiniS,Liao NY,Platt D,et.2009.De Novo secuencia del genoma de montaje OFA hongo filamentoso utilizando Sanger, 454 datos de secuencia andIllumina.Biol genoma10: R94. 53.Miller JR, Delcher AL, Koren S, et al. 2008.Aggressiveassemblyofpyrosequencing lee con compañeros.bioinformática 24: 2818- 24. 54.Chen W, R Ullmann, Langnick C, et al. análisis 2009.Breakpoint del cromosoma equilibrada reordenamientos de secuenciación de próxima generación de extremo emparejado.Eur J Hum GenetDol: 10.1038 / ejhg .2009.21118 [Epub ahead of print]. 55.Zimin AV, Delcher AL, Florea L, et al. 2009.A ensamblaje del genoma completo Ofthe doméstica vaca, Bos taurus. Biol genoma10: R42. 56.Zhou X,Su Z,Sammons RD,et.2009.Novelsoftware Paquete forcross-platformtranscriptomeanalysis (CPTRA).BMC Bioinf. 11: S16. 57.Kim JI, Ju YS, parque H, et al. 2009. Un highlyannotatedwhole-genomesequenceofa Corea del individuo. Naturaleza 460: 1011-5. 58.Linsen SE, de Wit E, Janssens G, et al. 2009.Limitations y posibilidades ofsmallRNA digitalgeneexpressionprofiling.NatMethods 6: 474-6. 59.QuailMA,Swerdlow H,Turner DJ.2009.Improved protocolos para la Illumina Genoma Analyzersequencing sistema.CurrProtocHum Genet Capítulo 18: Unidad de 18.2. 60.Briggs AW, Stenzel U, Meyer M, et al. 2009.Removal de citosinas deaminados y detección ción deen vivo metilación en ancientDNA.Nucleic Acids Res 38(6): e87 [Epub aheadof de impresión]. 61.T Maricic,Pääbo S.2009.Optimization of454 preparación biblioteca de secuenciación de pequeños cantidades de ADN permite secuencia de determi-nación ofboth cadenas de ADN.Biotechniques46: 51-2, 54-7. 62.N Rohland, Horfreiter M.2007. Comparisonand extracción de optimización ofancientDNA. Biotechniques 42: 343-52. 63.Wheeler DA, Srinivasan M, Egholm M, et al. 2008. El genoma completo de un individualby secuenciación del ADN masivamente paralelo. Naturaleza452: 872-6. 64.O Harismendy, PC ng, Strausberg RL, et al. 2009. Evaluación de los estudios sequenc- ingplatformsforpopulationtargetedsequencing de próxima generación. Biol genoma10: R32. sesenta y cinco.Chaisson MJ, Brinza D, Pevzner PA. ensamblaje fragmento de novo con 2009.De corta mate- emparejado lee: ¿Es importante la longitud de leer? Genome Res 19: 336-46. 66.Krause J, Briggs AW, Kircher M, et al. 2009.A ADNmt genoma completo de un mo- temprana ern humana de Kostenki, Rusia.Curr Biol20: 231-6. 67.Un Gnirke, Un Melnikov, Maguire J, et al. 2009.Solution selección de híbridos con oli- ultra-larga gonucleotides para masivamente paralelo dirigida secuenciación. Nat Biotechnol27: 182-9. ......Métodos, Modelos y Técnicas M. y J. Kircher Kelso Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 535 Métodos,ModelosyTécnicas
  • 13. 68.Hodges E,Rooks M,Xuan Z,etla selección de los intervalos de .2009.Hybrid genómicas discretas en microarrays de diseño personalizado Formas- sivelyparallelsequencing.NatProtoc4: 960-74. 69.Briggs AW, bueno JM, RE verde, et al. 2009.Targetedretrievalandanalysisoffive NeandertalmtDNA genomas.ciencia 325: 318-21. 70.MeyerM,StenzelU,HofreiterM.secuenciación 2008.Paralleltagged en la plataforma 454 formar. Nat protoc 3: 267-78. 71.Meyer M,StenzelU,Myles S,et.2007.Targetedhigh- Throughputsequencingof etiquetados muestras de ácidos nucleicos.AcidsRes nucleicos 35: E97. 72.Y Erlich,Chang K,A Gordon,et.2009.DNA Sudoku - el aprovechamiento de alto rendimiento secuenciación de muestras multiplexadas Analy-sis. Genome Res 19: 1243-1253. 73.Meyer M, Kircher M. 2010. Illumina sequenc-ing preparación para la biblioteca altamente multiplexados orientar la captura y secuenciación.Fría SpringHarb protoc DOI: 10.1101 / pdb.prot5448. 74.pop M,Salzberg SL.2008.Bioinformaticschallenges ofnew tecnología de secuenciación. Trends Genet 24: 142-9. 75.Richter BG, Sexton DP. 2009. La gestión de andanalyzingnext-generationsequencedata. PLoS Comput Biol5: E1000369. 76.codornices MA, me Kozarewa, Smith F, et al. mejoras de 2008. Una gran centro al genoma sistema de secuenciación de Illumina. Métodos Nat 5: 1005-1010. 77.BatleyJ,EdwardsD.2009.Genomesequence datos: gestión, almacenamiento, andvisualization. Biotechniques 46: 333-4, 336. la investigación tiene como objetivo 78.IBM Research.2009.IBM tobuild secuenciador de ADN para ayudar a nanoescala unidad costos bajos de análisis genético personalizado. InLoughran M, ed .; Notas de prensa, Vol. 2009.new York: IBM. 79.Eid J, Un Fehr, Gray J, et al. 2009. Real-timeDNA secuenciación de una sola moles polimerasa ecules. ciencia 323: 133-8. 80.Y Astier, O Braha, Bayley H. 2006. TowardsinglemoleculeDNAsequencing: directa ofribonucleoside identificación y deoxyri-bonucleoside 50-monophosphates por usingan ingeniería de proteínas nanoporos EQUIPPEDWITH un molecularadapter.Soc J Am Chem128: 1705-1710. 81.Albertorio F, Hughes ME, Golovchenko JA,et.2009.Base DependentDNA-carbono interacciones de nanotubos: la activación enthalpiesand montaje disassemblycontrol.Nano- tecnología 20: 395.101. 82.Medvedev P,Stanciu M,Brudno M.2009.Computationalmethodsfordiscovering structuralvariationwithnext-generationsequencing. Métodos Nat 6: S13-20. 83.PepkeS,Wold B,MortazaviA.2009.ComputationforChIP- seqandRNA-seqstudies. Métodos Nat 6: S22-32. 84.FlicekP,BirneyE.2009.Sensefromsequence lee: métodos de alineación y Asamblea. Métodos Nat 6: S6-12. 85.Parque PJ.2009.ChIP-ss: ventajas andchallengesofa tecnología de maduración.Nat Rev Genet 10: 669-80. 86.WallPK,Leebens-J Mack,ChanderbaliAS, et al. 2009. Comparación de la próxima generación sequencingtechnologiesfortranscriptomecharacterizatio n. BMC Genomics 10: 347. 87.Holt RA, SJ Jones. 2008. La nueva secuenciación celda de flujo paradigmof. Genome Res 18: 839- 46. 88.DalcaAV,BrudnoM.2010.Genomevariationdiscoverywith high rendimiento los datos de secuenciación. Breve Bioinf. 11: 3-14. M. y J. Kircher Kelso Métodos, Modelos y Técnicas ..... 536 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. Métodos,ModelosyTécnicas