D912f51131ed787b91.en.es

Métodos, Modelos y Técnicas
De alto rendimiento de secuenciación de ADN,
conceptos y limitaciones
Martin Kircher y Janet Kelso !
Introducción
En 1977, el firstgenome, thatofthe
5.386 nucleótidos (nt), de un solo
strandedbacteriophagewX174, era
completamente
secuenciada [1] usingatechnologyinvented sólo unos
pocos años antes [2-5] .Sincethen thesequencing
ofwholegenomes, así como de los genes individuales
Regiones, así como se ha convertido en un foco
importante de
la biología moderna y completamente trans-
forman el campo de la genética.
ATTHE tiempo Ofthe de secuenciación
wX174, y durante casi una década,
Secuenciación de ADN Wasa apenas automático
acoplado y proceso muy tedioso whichinvolved
determinar sólo unos pocos nucleótidos Hun-Dred a
una time.In los late1980s, semi-
automatedsequencerswith mayor throughputbecame
vano-poder [6, 7], stillonly capaz de determinea
pocas secuencias ATA tiempo .Es posible el avance
en 1990swasthedevelopment theearly del conjunto
de capilares electro-foresis y apropiados de
detección sys-tems [8-12] .Como reciente como
1996, thesedevelopmentsconverged en ThePro-
ducción de un solo capillarysequencer comercial (ABI
Prism 310). En 1998, Thege Salud MegaBACE 1000 y
theABI Prism 3700 DNA Analyzer
becamethefirstcommercial96capillarysequencers, un
desarrollo que wastermed secuenciación de alto
rendimiento.
Overthelastdecade, alternativa
sequencingstrategieshavebecomeavailable [13-18],
que nos obliga a com-pletelyredefine''high-
throughputsequencing. '' Estos technologiesout-
realizar-theolderSanger sequencingtechnologies por un
factor of100-1,000in rendimiento diario, y
sametimereducethecostofsequencingonemillionnucleot
ides atthe (1 Mb) to4-0.1% de la asociada con
Sangersequencing.Toreflectthesehugechanges,
severalcompanies, investigación-res, y las recientes
revisiones [19-24] el uso theterm''next-
generationsequencing''instead de secuenciación de
alto rendimiento, sin embargo, este término en sí
mismo puede ser muy pronto
outdatedconsideringthespeedofongoingdevelopments.
DOI 10.1002 / bies.200900181
Departamento de Genética Evolutiva del Instituto Max
Planck de Antropología Evolutiva, en Leipzig, Alemania
*Autor correspondiente:
Janet Kelsoe-mail:
kelso@eva.mpg.de
Abreviaturas: A / C / G / T, Desoxiadenosina, desoxicitosina,
desoxi-guanosina, desoxitimidina;ATP,Trifosfato de adenosina;
dATPunaS, Desoxi-adenosina-5 '- (alfa-tio) trifosfato; CCD,
Dispositivo con carga acoplada,
es decir, el dispositivo semiconductor utilizado en las cámaras digitales;
Chip-Sec, Cromatina inmunoprecipitación Sequen-cing; CNV,
Número de copias variación; dNTP / PNT, Desoxi-
nucleótidos;ddNTPs, Didesoxi-nucleótidos (nucleótidos modificados
que faltan un hidroxilo
grupo en
el tercer átomo de carbono Ofthe azúcar);Georgia,
ShortforIllumina Analizador Genoma;InDel, Inserción /
deleción;kb / Mb / Gb, Kilobase (l03nt) / megabase (106nt) /
base giga (l09Nuevo Testamento);MeDIP-Sec, Metil-ación-
DependentImmuno-Precipitationsequen- cing; nucleótido (s)
nt;PCR,Reacción en cadena de la polimerasa;RNA-Seq,
SequencingofmRNAs / transcripciones;SABIOExpresión
SerialAnalysisofGene;SNP,Polimorfismo de nucleótido simple;
ARNm, El ARN mensajero / transcripciones.
Los recientes avances en la secuenciación del ADN han revolucionado el campo de la genómica, por lo que
es posible que incluso los grupos de investigación individuales para generar grandes cantidades de datos
ofsequence muy rápidamente y ATA tecnologías de alto throughputsequencing sustancialmente
lowercost.These hacer profunda transcriptquantification transcriptoma sequencingand, y la secuenciación
del genoma completo de resequencingavailable muchos más investigadores y projects.However, mientras
que el tiempo costand se han reducido en gran medida, los perfiles de error y las limitaciones de las
plataformas TheNew difieren significativamente de las de los anteriores de secuenciación Technol-gías. La
selección de una plataforma de secuenciación apropiado para determinados experimentos TIPOSDE es una
consideración importante,
y requiere una comprensión detallada
pie de las tecnologías disponibles; incluyendo fuentes de error, tasa de error, aswell como la velocidad y el
coste de la secuenciación. Se revisan los conceptos relevantes andcompare las cuestiones planteadas por
los sequencingtechnologies currenthigh-throughputDNA. Analizamos cómo los futuros desarrollos pueden
superar estos Limita-ciones y lo que sigue habiendo dificultades.
Palabras clave:.ABI / vida Sólidos tecnologías; Helicos HeliScope; Illumina Genoma Analizador; Roche / 454 GS FLX
Titanium; secuenciación capilar Sanger
524www.bioessays-journal.com Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.
Métodos,ModelosyTécnicas

A continuación repasamos los cinco secuenciación
las tecnologías actualmente disponibles en themarket
(capillarysequencing, pyrose-secuenciación,
reversibleterminatorchem-terio, secuenciación por
ligación, y la química virtualterminator), discuten las
limitaciones intrin-sic ofeach, y proporcionan
anoutlook en la nueva technologieson
thehorizon.Weexplainhow thevastincreases en
throughputare associatedwith tanto nuevos y viejos
tipos de problemsin los datos de la secuencia
resultante, y
howtheselimitthepotentialapplicationsand plantean
desafíos para el análisis de datos.
secuenciación capilar Sanger
CurrentSangercapillarysequencingsystems, al
igual que el instrumento
AppliedBiosystems3xxxseriesortheGEHealthcare
MegaBACE ampliamente utilizado,
son
aún basado en la misma schemeapplied en general
en 1977 para lawX174 genoma [1,3] .First, millones
ofcopies ofthesequence que se determine se
purifiedor amplificada, dependiendo de la fuente
Ofthe synthesisis cadena sequence.Reverse realizado
en estas copias utilizando aknown cebado secuencia
ascendente Ofthe secuencia para determinar y
amixture ofdeoxy-nucleótidos ( dNTPs,
thestandardbuildingblocksofDNA) y didesoxi-
nucleótidos (ddNTP,
nucleótidos modificados falta un grupo hidro-Xil en el
tercer átomo de carbono de thesugar) .ThedNTP /
ddNTPmixturecauses al azar, no reversible termin-
ationoftheextensionreaction, la creación de los
diferentes ejemplares moles eculesextended a
differentlengths.Following desnaturalización y
nucleótidos upoffree limpias, cebadores, y theenzyme,
theresulting moleculesaresorted por su peso
molecular (corre-corres- al pointoftermination) y la
etiqueta pegada a la ddNTPs terminat-ción se lee de
forma secuencial enel orden creado por la etapa de
clasificación. representación Aschematic de disponible
en la Fig este processis. 1.
Clasificación por molecularweightwas
originalmente realizada usando gel electro-
foresis, pero se lleva a cabo hoy en día
bycapillaryelectrophoresis [7, 25].
Originalmente, radiactivo o opticallabelswere
aplicado en cuatro terminatorreactions diferentes
(cada uno ordenados y leer outseparately), pero hoy
en día cuatro de gripe orophores diferentes, uno por
cada nucleótido (A, C, G y T) se utilizan en una sola
reacción [6] .Additionally , el advenimiento de más
sensi-tivedetectionsystemsandseveralrounds de
extensiones de cebadores
(equivalenttoalinearamplification) cantidades
permitsmaller de ADN de partida a beused para
reacciones de secuenciación modernos.
Por desgracia, hay stilllittle forcreation auto-mación
Ofthe alta copyinputDNA con cebado conocida
sites.Typically esto se hace mediante la clonación,es
decir., La introducción de la secuencia diana en la
secuencia del vector aknown mediante ligadura
restrictionand proceduresand usando abacterialstrain
para amplificar el targetsequence en vivo - Por lo
tanto exploitingthelow
amplificationerrorduetoinherent corrección de
pruebas y reparación mech-anisms.However, este
proceso es verytediousand issometimeshamperedby
dificultades tales como la clonación
specificsequencesdue a theirbase compo-sición, la
longitud, y se utiliza
interactionswiththebacterialhostsystem.Althoughnoty
etwidely, integrado micro-fluidicdeviceshavebeen
developedwhich tienen como objetivo automatizar el
ADN extrac -ción, in vitro amplificación, y sequenc-
ción en el mismo chip [26-29].
UsingcurrentSangersequencing
tecnología, itistechnically possibleforup 384
secuencias [29,30] ofbetween 600 y 1.000 longitud
ntin [23,31] para ser secuenciados en
parallel.However, éstos systemsare 384-capilar rara.
El más estándar de 96
capillaryinstrumentsyieldamaximum ofapproximately
6 Mb ofDNA sequenceperday, con
costsforconsumablesamounting a alrededor de $ 500
por
1 Mb.
Figura 1.Representación esquemática de la secuenciación de Sanger proc-ess. Entrada
de ADN se fragmenta y se clonó en bacterias vectores para
en vivoamplificación. síntesis de la cadena inversa se lleva a cabo en las copias
theobtained a partir de una secuencia de cebado conocido y utilizando amixture ofdeoxy-
nucleótidos (dNTPs) y didesoxi-nucleótidos (ddNTPs). La mezcla de dNTP / ddNTP provoca
la extensión azar
para ser terminado no reversible, creando de manera diferente extendida mol-
ecules.Subsequently, después de la desnaturalización, limpiar offree nucleoproteínas
mareas, los cebos, y la enzima, las moléculas resultantes se sortedusing electroforesis
capilar por theirmolecularweight (corre-corres- al pointoftermination) y la
fluorescentlabelattached a los ddNTPs de terminación se lee de forma secuencial.
......Métodos, Modelos y Técnicas M. y J. Kircher Kelso
Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc. 525

ThesequencingerrorobservedforSangersequencing
duetoerrors ismainly en la etapa de amplificación (a
Baja Velocidad cuando se hace en vivo), Naturalvar-
iance, y la contaminación en el sampleused, así como
el deslizamiento de la polimerasa atlow secuencias
complejidad como simplerepeats (número corto
tandemrepeats variables) y homopolímeros
(stretchesof el mismo nucleótido). Además,
lowerintensitiesandmissingterminationvariantstend a
conducir a la acumulación de sequencingerrors hacia
el final oflong combinación sequences.In separación
withreduced por el electrophore-sis, basemiscalls [32]
y deletionsincreasewith leer length.However, la tasa
de error promedio (promedio de las bases generales
de una secuencia) después sequenceend recorte es
normalmente muy baja, withan error cada 10.000-
100.000 nt [33].
Roche / 454 GS FLX
Titaniumsequencer
La plataforma de secuenciación 454 era
thefirstofthenewhigh rendimiento
themarket secuenciación platformson
(publicado en octubre de 2005). Esta basado
en el enfoque de pirosecuenciación desa-desa- por
Pal Nyre'n y Mostafa Ronaghiatthe RoyalInstitute
tecnologia, Estocolmo en 1996 [34] .En la tecnología
contrasttothe Sanger, pyrosequencingis basado en
iterativa
complementingsinglestrandsandsimultaneouslyreadi
ng fromthenucleotidebeingincorporated (también
llamada secuenciación por síntesis, secuenciación
durante la extensión) outthesignalemitted .
Electro-
foresis tanto, ya no requiredto generar una ordenada
lectura de thenucleotides, Asthe leer outisnowdone
simultáneamente con la sequenceextension.
Inthepyrosequencingprocess
(Fig.2), un nucleótido tiempo ata
iswashedoverseveralcopiesofthesequenceto
bedetermined, causingpolymerases para incorporar
el núcleo-marea si es complementario a la cadena
tem-placa. La incorporación se detiene Siel tramo
longestpossible ofcomp-
lementarynucleotideshasbeen
sintetizado por la polimerasa. En el
proceso de incorporación, uno pyrophos-fosfato
pernucleotide isreleased andconverted de ATP por
un ATP sulfurylase.The ATP impulsa la reacción luz
de Luci-ferases presentand la
lightsignalismeasured.TopreventthedATP emitida
proporcionan para reactionfrom secuenciación que
se utiliza directamente en la lightreaction, desoxi-
adenosina-5
0
- (unatio) -
trifosfato (dATPunaS), que no es
asubstrateoftheluciferase,
isusedforthebaseincorporation reaction.Standard
nucleótidos de desoxirribosa
son
utilizado para todos los otros nucleótidos. Después
de casquillo-Turing la intensidad de la luz, los
nucleótidos se remainingunincorporated
washedawayandthenextnucleotideisprovided.
En 2005, la tecnología de pirosecuenciación
fue paralelizado en una placa picotituladora by454
Ciencias de la Vida (más tarde comprada por Roche
Diagnostics) para permitir alta throughputsequencing
[16] .El secuenciación platehas unos dos millones de
pozos - cada uno ofthem abletoaccommodateexactly
un 28-mtalón m de diámetro cubierto con
Figura 2.El proceso de pirosecuenciación. Uno de los cuatro nucleótidos iswashed
secuencialmente sobre copias de la secuencia que se determine, haciendo que las
polimerasas de incorporar incorporación nucleotides.The complementaria se detiene si
el tramo más largo posible del vano-ablenucleotidehasbeensynthesized.Intheprocessof
incorporación, uno pernucleotide pirofosfato se libera andconverted de ATP por
un ATP sulfurylase.The ATP impulsa el lightreaction ofluciferasespresentand un
lightsignalproportional (dentro de unos límites) a las incorporaciones
numberofnucleotide puede bemeasured.
M. y J. Kircher Kelso Métodos, Modelos y Técnicas
.....
526 Bioensayos 32: 524-536,! 2010 Wiley publicaciones periódicas, Inc.

se determinarán copias de una sola hebra de la
sequenceto. Las cuentas son
incubatedwithapolymeraseandsingle-
strandbindingproteinsand, perlas de togetherwithsmaller
que llevan las luciferasas de azufre-ylasesand ATP,
gravitationallydeposited en los pocillos. nucleotidesare
libre luego se lava sobre el flujo de células yla luz emitida
durante el Incorpora-ción se captura para todos los pozos
en parallelusing una alta resolución de carga-
coupleddevice (CCD), características exploitingthelight-
transporte de
el plato
usado.
Una Ofthe principales requisitos para
la aplicación de esta serie basada en pyrosequenc-
ingapproach iscoveringindividualbeads con múltiples
copias del samemolecule. Esto se realiza por primera
creatingsequencinglibrariesin que
everyindividualmolecule recibe dos
differentadaptersequences, uno atthe 50endand uno
en el 30final de la molecule.In el caso de la / Roche
preparación sequencinglibrary 454 [16], esto se hace
bysequentialligation oftwo oligos pre-Synthes-zados.
Uno de los adaptadores añadió iscomplementary a
oligonucleótidos enel perlas de secuenciación y, por
tanto allowsmolecules para ser unido a las perlas
byhybridization.Low molécula-a-beadratios y la
amplificación de la secuencia de doble cadena hybri-
dized en thebeads (keptseparate usando
emulsionPCR) hace itpossible para crecer beadswith
miles ofcopies OFA
singlestartingmolecule.Usingthesecondadapter, perlas
cubiertas con moleculescan beseparated de perlas
vacías (usando perlas de captura especiales con oligo-
nucleótidos complementarios al adaptador sec-ond) y
arethen utilizados enla asdescribedabove reacción de
secuenciación.
La sustitución promedio (excluyendo
inserción / deleción, InDel tasa de error) es enel
intervalo de 10 "3
-10"4[16, 35], que es
higherthantheratesobservedforSangersequencing,
butis la sustitución ERRORRATE lowestaverage
ofthenew tecnologías de secuenciación
discussedhere.As mencionados earlierfor
Sangersequencing, in vitro amplificaciones por-
formados para la secuenciación preparationcause
una tasa de error de fondo superior,
es decir., El error introducido en la
samplebeforeitentersthesequencer.Inaddition,
inbeadpreparation (es decir., PCR en emulsión) una
fracción Ofthe beadsend hasta
carryingcopiesofmultiple
differentsequences.These''mixedbeads '' van a
participar en un alto incorporaciones numberof por
ciclo de flujo, como resultado-ción en la secuenciación
readsthatdo notreflectrealmolecules.Mostofthesereads
se filtran automáticamente duringthe software de post-
procesamiento del filtrado data.The de granos mixtos
puede, cómo-ever , causar un agotamiento de
sequenceswith real de una alta fracción
ofincorporationsper ciclo de flujo.
Alargefractionoftheerrors
observadas para este instrumento son smallInDels, en
su mayoría derivados de
inaccuratecallingofhomopolymerlength, andsingle
deleciones de pares de bases o insertionscaused por
thresholdingissues señal-ruido [35]. La mayoría de
estos problemas Canbe resuelto por una mayor
cobertura. Por mucho(>10 nt) homopolímeros, sin
embargo, a menudo Thereis una longitud miscall
coherente thatis notresolvable por la cobertura [35-37]
.Stronglightsignalsin onewellofthe PicoTiterPlate
también puede resultininsertions en secuencias en
neighboringwells. Si el pozo vecino está vacía,
thiscangenerateso-calledghostwells,es decir., Pozos
para el cual un signalisrecorded pesar de que
contienen plantilla noSequence; por lo tanto, los Inten-
sidades medidos son completamente causedby
sangrado a lo largo de la señal del vecino-ing
wells.Computationalpost-proceso-ción puede corregir
estos artefactos [38] .Como para la secuenciación de
Sanger, el rateincreaseswiththepositioninthesequence
error. En el caso de la secuencia 454, esto es causado
por una reducción en enzymeefficiency o pérdida de
enzimas (resultingin una reducción de la intensidad de
señal), algunas moléculas ya no ser elong-ado y byan
increasingphasingeffect.Phasingisobserved cuando
apopulation de moléculas de ADN amplifiedfrom
thesamestartingmolecule ( ensemble) se secuencia, y
describesthe proceso en el que no todas las moléculas
intheensembleareextended en everycycle. Esto hace
que las moléculas en theensemble perder sincronía /
fase, andresultsin un oftheprecedingcycles de eco que
se añaden a la señal como el ruido.
Thecurrent454 / RocheGSFLX
plataforma de titanio hace posible tosequence
alrededor de 1,5 millones de tales beadsin un solo
experimento y para determinesequences oflength
entre 300 and500 nt. La longitud de la lee es deter-
minado por el número de ciclos de flujo
(thenumberoftimesallfournucleotides
se lavan sobre la placa) como wellasby la composición
de base y el orden Ofthe bases en la secuencia a
disuadir-minadas. Actualmente, 454 / Roche limita
thisnumber a 200 ciclos de flujo, lo que resulta Inan
longitud averageread esperado ofabout400
nt.Thisislargely debido tolimitationsimposed por los
efficiencyofpolymerases y luciferasas,
cual
cae sobre la carrera de secuenciación, resultingin
disminuyó plataformas qualities.Currentlythe base
permite about750 secuencia Mb ofDNA que se creará
perdaywith costes de unos 20 $ / Mb.
Illumina Genome Analyzer II / IIx
Thereversibleterminatortechnologyused por el
Illumina Genome Analyzer (GA) employsasequencing-
por-sin-tesis conceptthatis similarto thatused en
Sangersequencing,es decir.theincorporation reacción
se detuvo aftereach base, la etiqueta de la base
incorp corporado-se lee con tintes fluorescentes, y la
reacción de secuenciación es entonces con-continuó
con la incorporación ofthenext de base [13, 39] (Fig.
3).
Like454 / Roche, theIllumina
protocolrequires secuenciación thatthesequences que
se determinen son acondicionado verted en una
biblioteca de secuenciación especial, lo que les
permite ser amplificado andimmobilized para la
secuenciación [13, 40]. Forthis propósito dos
adaptadores diferentes areadded al 50y 30extremos
de todos MOL-ecules utilizando la ligadura de los
llamados forkedadapters.1La biblioteca es entonces
amplifiedusing secuencias de cebador más largo,
cual
extendandfurtherdiversifytheadapters para
crear la finalsequenceneeded en pasos
posteriores.
Thisdouble-strandedlibraryis
meltedusingsodium hydroxidetoobtainsingle-
strandedDNAs, whichare luego se bombea a un muy
bajo concen-tración a través de los canales de una
célula de flujo. Esta celda de flujo tiene en su
superficie twopopulationsofimmobilizedoligonu-
cleotidescomplementarytothetwodifferentsingle
hebra adapterendsof la secuenciación library.These
oligo-nucleotideshybridizetothesingle-
1
Los híbridos de oligonucleo- parcialmente complementaria
mareas creando un extremo de doble cadena con un
Toverhang, con un de cadena sencilla y un differentsequence
en el otro extremo.

moléculas de la biblioteca varados.por inversa
síntesis de la cadena a partir de la parte hybri-dized
(de doble cadena), el
newstrandbeingcreatediscovalentlybound a la celda de
flujo. Si este nuevo strandbends más y se une a otro
oli-gonucleotide complementaria a la secuencia
adaptador sec-ond en el extremo libre Ofthe hebra,
que puede ser utilizado para sintetizar una segunda
strand.Thisprocessofbending inverso unido
covalentemente y síntesis reversestrand, llamado
puente amplifi-cación, se repite severaltimes
andcreates grupos de varios 1.000 copiesofthe
originalsequence en muy closeproximity de la otra en
la celda de flujo [13, 40].
Estos grupos distribuidos al azar
contienen
moleculesthatrepresenttheforwardaswellasreversestra
ndsof las secuencias originales. Antes de disuadir a-la
minería de la secuencia, uno de los
strandshastoberemovedtopreventitfrom
obstaculizando los
reactionstericallyorbycomplementarybasepairing.Stra
nds de extensión son modificaciones de forma
selectiva cleavedatbase ofoligonucleoti-des en el
strandremoval cell.Following flujo, cada grupo en los
cellconsists flujo deHabitación trenzado, copias
identicallyoriented Ofthe misma secuencia; que
puede ser secuenciado por hibridación
el cebador de secuenciación en los
adaptersequences y comenzar la química
reversibleterminator.
'' '', Solexasequencing asitwas
introducedinearly2007, initiallyallowed para la
administración simultánea sequenc-ción de varios
millones de Sequen-ces muy cortos (nt atmost26)
inasingleexperiment.In los últimos años se havebeen
severaltechnical, química, andsoftware updates.The
producto, whichisnow llama
theIlluminaGenomeAnalyzer, ha aumentado
clusterdensities celda de flujo (más de 200 millones
clus-tersperrun), un widerrangeoftheflow
cellisimaged, andsequencereads de hasta 100 nt
pueden ser generated.A technicalupdate también
permitió thesequencingofthereversestrand ofeach
molecule.Thisisachieved bychemicalmelting y lavado
awaythe secuencia sintetizada,
la repetición de una
síntesis de la cadena
bridgeamplificationcyclesforreverse pocos, y luego
selec-tivelyremovingthestartingstrand (de nuevo
usando modificaciones de bases de
el
celloligonucleotide poblaciones de flujo),
beforeannealing anothersequencingprimer para
el segundo read.Using this''paired-
endsequencing''approach,
approximatelytwicetheamountofdata puede
haber generated.The Illumina
libraryandflowcellpreparationincludes variosin vitro
amplificationsteps, lo que causa un alto grado
backgrounderror y contribuir a la tasa ofabout10
averageerror"2-10"3[41,42] .Further, theflow fracción
cellpreparationcreatesa ofordinary-
lookingclustersthatare inició a partir de secuencias de
calidad mostlylow uno signalsand
individualsequence.Theseresultsin mixta morethan de
estos clusters.Similarto the454 ghostwells,
theIllumina identifychemistrycrystals imagen
analysismay, polvo, andlintparticles como racimos y
llaman sequencesfrom these.In tales casos, las
resultingsequences típicamente parecen ser de
complejidad lowsequence.
Como es el caso para las otras plataformas,
La tasa de error aumenta con increasingposition en los
sequence.This determinada se debe principalmente a
la eliminación gradual, proceso de secuenciación
whichincreasesthebackgroundnoiseassequencingprogr
esses.Whiletheensemble de piro-
sequencingcreatesuni-directionalphasing, crea
reversible terminador sequenc-ción bi-
directionalphasing [41,43] como algunos incorporan
también nucleotidesmay fallar a darse por terminada
correctamente -permitiendo la extensión de la
secuencia
por otro nucleótido en el mismo ciclo.
Figura 3.Terminator química reversible aplicada por los cebadores Illumina GA.Sequencing
se recuecen a los adaptadores de la sequencesto determinar. Las polimerasas se utilizan
para ampliar las sequencingprimers por incorporación offluorescently etiquetados y
terminatednucleotides.The incorporación se detiene inmediatamente después de The
firstnucleotide debido a la terminators.The polymerasesand libre
nucleótidos son lavados y la etiqueta de las bases incorporatedfor cada secuencia se lee
con cuatro imágenes tomadas a través differentfilters (filtro de nucleótido T se indica en la
figura)
y el uso de dos
láseres diferentes (rojo: A, C y verde: G, T) para iluminar fluorophores.Subsequently, los
fluoróforos y terminadores se eliminan yla secuenciación continuó con la incorporación
de la base siguiente.
.....

Con increasingcyclenumbers, theintensities extraen
de la clustersdecline [41, 43, 44]. Esto es debido a
fewermolecules que participan en el
extensionreaction como resultofnon-
reversibletermination, o debido a la atenuación
effectsof los fluoróforos de secuenciación. En
earlyversions Ofthe química, uno
ofthefluorophorescould becomestucktothe grupos
que crean otra fuente ofincreased ruido de fondo
[41].
la
simultaneousidentificationoffourdifferentnucleot
ides es también un cuestión.La GA utiliza
fourfluorescentdyes todistinguish los
fournucleotides A, C,
G, y T.Of estos, dos pares (A / C y G / T) excitado
usando el mismo láser, son
similarin theiremission espectros andshow única
separación limitado el uso de filtros Opti-cal. Por lo
tanto, las mayores errores substi-tución son
observadas entre A / Cy G / T [41, 42].
A pesar de que el Illumina GA lee
mostrar ahigheraverageerrorrate, un errorrange
wideraverage, y areconsiderablyshorterthan
454 / Rochereads, el GA
instrumentdeterminesmore de 5.000 Mb / día
con un priceofabout0.50 $ / Mb.This es más
thansix veces mayor rendimiento diario
y
foraconsiderablylowerpricepermegabase.
Applied Biosystems SóLIdAS
Theprototypeofwhatwasfurtherdevelopedandlatersol
dbyLifeTechnologies / Applied Biosystems (ABI)
como la plataforma de secuenciación sólida,
wasdeveloped por Harvard
MedicalSchoolandtheHowardHughesMedicalInstitute
y publicados en 2005 [17] .Con
itscommercialreleasein finales
2007, sólido fue sólo el tercer newhigh-
throughputsystem mercado enteringahighly
competitiva con todo threevendorsselling
theirinstrumentsforaroundhalfamilliondollars.TheChu
rch laboratorio de la Universidad de Harvard
MedicalSchoolcontinuedthedevelopmentofthesystem
andnow offersacheaper (<$ 200.000) SourceVersion
abierta Ofthe sistema (llamado Polonator) en colab-
oración con el sistema de Dover. En el thirdquarter
de 2008, un com-biotecnología empresa de
Mountain View, California,
namedCompleteGenomicsstartedoffering una
tecnología genoma humano sequencingservice.Their
se basa también
ontheChurchlabsequencing por ligadura de
concepto, pero itwitha combina nueva estrategia
libraryconstruction ofsequencing y la secuencia
immobiliz-ación utilizando círculo amplificación de
laminación [45]. Aquí, nos centramos en el sistema
commercialSOLiD ya que esta es la aplicación más
extendida de este concepto.
Theprinciplebehind sequencing-
por la ligadura isvery differentFrom
theapproachesdiscussedthusfar.Thesequence
reacción de extensión no es coche-Ried polimerasas
outby butrather byligases [17] (véase la Figura 4
para un schematicrepresentation Ofthe plat-forma
sólida 2/3) .Inthesequencing por ligationprocess, es
un cebador de secuenciación hybri-dized de copias
de una sola hebra de
el
moléculas de la biblioteca para ser
sequenced.Amixture sondas OF8-mer que llevan
fourdistinctfluorescentlabels compiten forligation
al cebador de secuenciación.
la
codificación fluoróforo, que es BasedOn los dos
30-mostnucleotides oftheprobe, se ofrecen las
bases read.Three incluidoel tinte se escinden
del 5
0
final de
la sonda, dejando una libre 50
fosfato de
la extendida (por cinco nucleótidos) pri-mer, que a su
vez está disponible para furtherligation.After múltiples
ligaduras (typi-camente hasta 10 ciclos), el
synthesizedstrandsaremelted y theligationproductis
arrastrado ante un newsequencingprimer
(shiftedbyonenucleotide) se annealed.Starting fromthe
nueva secuenciación el cebador ligationreaction se
repite. El mismo proceso isfollowed para otros tres
cebadores, facili-litar la lectura de la
dinucleotideencoding para cada posición de inicio en
thesequence.Usingspecificfluorescentlabelencoding, el
colorante salidas leídas (es decir.colors) se puede
convertir en una secuencia [46]. Esta conversión de
tosequence espacio de color requiere un firstbase
conocido, que es la última base de la
libraryadaptersequence.Given utilizado un
referencesequence, esto allowsdetection sistema de
codificación ofmachineerrorsand theapplication ofan
errorcorrection toreduce la theabsence promedio
errorrate.In de una secuencia de referencia, la forma
de la historia, color la conversión falla con un errorin el
tinte leer outand causesthesequence aguas abajo
Ofthe errortobe incorrecta.
Para la paralelización, la secuenciación
copias processusesbeadscoveredwithmultiple Ofthe
secuencia para bedetermined. Estas perlas se crean
en
de una manera similar a la descrita oído-lier para la
plataforma 454 / Roche. En contraste con-a la
tecnología 454 / Roche,
el
sólido sistema hace un Nouse forfixation
PicoTiterPlate Ofthe granos en proceso de
thesequencing; en lugar de la 3
0
extremos
de las secuencias en las perlas se modi-ficado de
manera thatallows obligado a becovalently en un
glassslide.As para el sistema de Illumina GA, este cre-
ates una dispersión aleatoria de las cuentas enla
cámara de secuenciación y permite densidades de
carga forhigher. Sin embargo dispersión, Ran-dom
complica la identi-ficación de las posiciones de
cuentas de las imágenes, y da lugar a la posibilidad
de que los cristales químico-cal, polvo y partículas de
pelusa canbe identificado erróneamente
asclusters.Further, la dispersión de los resultados de
los granos en una distancias widerangeofinter-grano ,
whichthen tienen diferente susceptibilidad a
beinfluenced por señales de neighboringbeads.
Tipos y causas de los errores de secuencia
son diversos: primero, la in vitro pasos amplifica-ción
causan un mayor backgrounderror rate.Secondly,
perlas que llevan amixture de secuencias y los granos
en closeproximity a falsereads uno anothercreate y
baja bases.Further calidad, disminución de la señal,
una pequeña phasingeffect regular,
andincompletedyeremovalresult en el aumento de
error como el ligationcyclesprogress [47] .Phasing,
asdescribed anteriormente, es una plataforma de
minorissue onthis como secuencias no extendedin el
último ciclo son no reversible ter-
minatedusingphosphatases.Sincehybridization
proceso estocástico isa, esto provoca una reducción
considerable enel número ofmolecules participatingin
subsequentligation reacciones,
andthereforesubstantialsignaldecline.On Por otro lado,
dado el efficiencyof fosfatasas la
phasingeffectcanbeconsideredverylow.However
restante, ofthedyes de escisión incompletas pueden
permitir la escisión en la reacción nextligation, que
luego allowsfor la extensión en el
nextbutonecycle.This causa una additionalnoise
differentphasingeffectand de colorantes de
theprevious de ciclo en el proceso de identi-ficación
colorante.
El sólido sistema permite en la actualidad
ofmore secuenciación de 300 millionbeads en
paralelo, con un typicalreadlength de entre 25
y 75 nt.
En el
momento de escribir, el sólido sistema ABI
istherefore comparable a la Illumina GA

sistema en términos de rendimiento y
pricepermillionnucleotides (#5,000 Mb / día,#0,50 $ /
Mb) .Average errorratesare, sin embargo, que
dependen del genoma de referencia OFA-vano
capacidad para errorcorrection (10
"3
-10"4vs. 10"2-10"3). En
theabsenceofa referencegenome, montaje y
consensuscalling El procedimiento puede realizarse
sobre la base de tinte leer outs (los llamados
colorspacesequences) toreduce los errores antes de la
conversión enel secuencia de nucleótidos. Si hay
referencegenome está disponible para la corrección de
errores, y no hay consenso callingis montaje y realiza,
a continuación, el error medio rateis superior a la de la
Illumina GA.
Helicos HeliScope
Helicos es la firstcompany a sellasequencer capaz de
secuenciar individualmolecules en lugar ofmolecule
ENSEM-bles creados por una amplificación proc-ess.
la secuenciación de una sola molécula tiene bybiases
theadvantagethatitisnotaffected o errores
introducidos en un paso librarypreparation o
amplificación,
y
puede facilitar ofminimalamounts de secuenciación
de entrada DNA.Using methodsable para detectar los
nucleótidos no estándar, sino que también podría
tener en cuenta las modificaciones del ADN
identificationof, perdió comúnmente enel in vitro
proceso de amplificación.
El HeliScope, como el sequenceris Helicos llamada, se
vendió por primera vez en marzo de 2008, y para el
final Ofthe firstquarter of2009 única
fourmachineshavebeeninstalled en todo el mundo.
Esto podría ser sur la extracción con palanca dadas
las ventajas de
soltero
moleculesequencing, butprobablyreflects tanto las
limitaciones específicas ofthisplatform, theprice
(dólares aboutonemillion), y un relativamente
smallmarket que ya ha invertido exten-vamente en
las nuevas tecnologías de secuenciación.
Thetechnologyapplied (figura 5)
que podría denominarse
virtualterminatorchemistry asíncrono [15]
.InputDNAisfragmentedandmeltedbefore
una
Figura 4.secuenciación de Solid Applied Biosystems por imprimación
ligation.Asequencing se hibrida con las copias de una sola hebra de Sequen-ces que se
determinen. Octamer sondas se hibridan, se ligan a thesequencing cebador, y un tinte
fluorescente en el 5
0
final del ligado
8-mer sondas, la codificación de los dos 30
nucleótidos -la mayoría de la sonda, es
leer dephosphorylated.Threenucleotides primersare extendidos-out.Non de la
sonda que incluye el colorante se escinden, creando un
libre 50fosfato para más ligaduras múltiples ligations.After, hebras thesynthesized se
funde y el producto de ligación es washedaway antes de una nueva, nucleótidos
desplazada por un cebador de secuenciación isannealed.Starting de la nueva
ligationreaction secuenciación primerthe se repeated.The mismo se hace forthree
otherprimers , lo que permite la lectura de la etiqueta dinucleótido
para cada posición en
la secuencia.
.....

poli-A-tailissynthesized molécula ontoeachsingle hebra
usando una polimerasa poli-ciclasa. En la última etapa
ofpolyadenylation, se añade un labeledadenine con
fluorescencia. La biblioteca es washedover un flujo
cellwhere poli-A tailsbind a poli-T
oligonucleotides.Thebound coordenadas en la celda
de flujo aredetermined utilizando una fluorescencia de
basedread fuera del flujo thesecoordinates cell.Having
detectadas, la fluorescentlabel de la 30adenina se
elimina
andthesequencingreactionstarted.Polymerasesare
lavó a través de theflow célula con un tipo de
nucleótido fluorescentlylabeled (A, C, G, o T) en atime
y las polimerasas se extienden thereverse hebra de
las secuencias startingfrom la incorporación de poli-T
oligonucleotides.Thenucleotide Ofthe poli-merases se
ralentiza por el etiquetado fluor-escent y permite
como máximo
una constitución antes de polímero-asa se elimina
por lavado junto con los nucleótidos Thenon-
Incorporated (termedvirtualtermination [48,49]). El
flowcellisthen fotografiado de nuevo, los tintes Fluor-
escent se eliminan, y la reac-ción continuó con otra
nucleotide.By este molécula proceso notevery
isextended en cada ciclo, que es whyit es una
secuenciación proc-ess asíncrono que resulta en
secuencias ofdifferentlength (como es el caso para
el 454 / Rocheplatform).
Ya que soltero moleculesare
secuenciado, siendo débil measuredare las señales, y
no hay posibilidad thatmisincorporationerrorscan
Becor-rected por un conjunto effect.Due enel hecho
de que las moléculas se unen enel celda de flujo sólo
por hibridación, thereis la posibilidad de que las
moléculas plantilla canbe pierden en el lavado
steps.In adición,
moleculesmay beirreversibly termi-nado por la
incorporación de nucleótidos incorrectlysynthesized.
En general, se lee
tienen entre 24 y 70 nt de longitud (nt average32) [50] y
por lo tanto más corto que para theother plataformas.
Debido a la mayor num-ber de secuencias determinadas
en paralelo, el rendimiento total por día (4150 Mb /
daywith un coste de #0,33 $ / Mb [50]) está en thesame
rango que forthe GA y SOLiDsystems.The tasa de error
promedio, whichisin la gama OFA pequeño tanto por
ciento, isslightly superior a la de todos los demás instru-
mentos y sesgada hacia Indeles sustituciones mas bien
que.
Aplicaciones y
generalconsiderations
Allcurrenthigh-throughputtechnol-gías tienen
un error medio tasa que
Figura 5.la química virtualterminator asíncrono realizado byThe ADN HeliScope.Input se
fragmenta, se derritió, y RELAClONADAS-polyadeny. Un adenina marcado con
fluorescencia se añade en el último paso. Thissingle de hebra de ADN se lava a través
de una celda de flujo
con poli-T oligo-
nucleótidos que permiten la hibridación. Las coordenadas consolidados sobre la
cellare flujo determina utilizando el marcado con fluorescencia adenines.Having las
coordenadas identificadas, el fluorescentlabelofthe 30adeninas se
removed.Polymerases se lavan a través con una
escriba nucleótidos de la etiqueta fluorescente (A, C, G y T) a la vez, y las polimerasas
se extienden la cadena inversa de las secuencias de
a partir de los oligonucleótidos de poli-T. El nucleótido Incorpora-ción de las
polimerasas se ralentiza por la labelingand fluorescente permite a lo sumo una
incorporación antes de la polimerasa iswashed away.The Cellis flujo entonces
fotografiado, la fluorescentdyesremoved, y la reacción continuó con otro nucleótido.

es considerablemente más alto que el /
10,000to1 / 100,000observedforhigh calidad
typical1
Sanger secuencias.
Además, theGSFLX titanio, GA, y plataformas
HeliScope SOLiD eachhave Limita-ciones biasesand
muy específicas, por lo que es necesario escoger
aplatform apropiado para una aplicación específica
proyec-ector (para un resumen verTabla 1). Una
combinación de tecnologías [51-54] y protocolos
experimentales [55-57] También puede ser apropiado,
y evencomplementary, para proyectos específicos.
De alto qualitySangersequencing
isnow commonlyused a generatelow-cobertura de la
secuenciación de individualpositions y regiones (p.ej.,
Diagnosticgenotyping)
genomes.AstheSangersequencelengthislongerthanmo
stabundantshortrepeat clases enteras y
orthesequencingofvirus--fago de tamaño, que permite
a los unambigu-ousassemblyofmostgenomicregions -
algo thatis generallynotpossibleusing
theshorterreadplatforms.However, la tecnología y
isexpensive demasiado lento para las muestras
sequencinglarge, extendidos genómicos re-regiones, o
las muchas moléculas
requiredforquantitativeapplications [p.ej., La
expresión génica cuantificación; cro-Matin
inmunoprecipitación sequenc-ing (chip-ss.),
Andmethylation dependiente de inmunoprecipitación
Sequen-cing (MeDIP-Sec)]
termsofsequencenumberandhastheadvantage
ForquantitativeapplicationstheHeliScopeprovidesthehi
ghestthroughputin de no requerir un protocolo de
preparación multisteplibrary. En el AT-herhand, el
HeliScope ofrece thelowest resolución en la
cartografía accuracyfor genomas complejos debido a
su corta readlength y errorprofile.TheGA orSOLiD
resultados cuantitativos para
platformsmaythusprovideequivalent dantes-cationes,
mientras que proporciona menos pero lon-
gerreadsandrequiringamoreelaborate preparación
biblioteca.
A pesar de que aún no ha sido totalmente analógica
lyzed, es posible (e incluso probable) thatlibrary
protocolos de preparación podrían biasthe
representación secuencia en una muestra [42, 58,
59], por lo que la sustitución ofthisstep un
importantgoal.Further, de múltiples etapas biblioteca
preparación
protocolsrequirehigheramountsofinputmaterial,
limitando theirgeneralappli-cation.However,
protocolsforlibraryconstructionfromlimitedsample
cantidades están disponibles orbeing desa-desa- para
cada una de las plataformas, y Pub-publica-
demuestran que, si bien vendorprotocols indican la
necesidad forhighersamplequantities (rango
microgramos), muchos usuarios están procediendo
cantidades de ADN de entrada successfullywith bajas
(nanogramto rango de picogramos), como, por
ejemplo, , las muestras de ADN fromancient [60-62].
Al igual que la secuenciación de Sanger, el GS FLX
El titanio proporciona una longitud de leer lapso de
Ning muchas de las secuencias repetidas cortas
- Un assemblyofgenomes
importantfeatureforaccuratesequencemappingand
[63] .A pesar de los errores indel, esta tecnología
tiene índices muy bajos ofmisidentifying bases
individuales, makingit perfectamente adecuado para
los identificationofsinglenucleotidepolymorphisms
(SNP). También dirigido a los identificationofSNPs,
atleastfor muestras con anexistingreferencegenome,
instrumento istheSOLiD con su
dinucleotideencodingscheme [46]
.Considerablyhighercoverage se necesita para
llamar performSNP con una precisión similar
usingtheIlluminaGA [64] .NeithertheIllumina GA ni
los sistemas sequenc-ing SOLiD ABI son propensos a
generar highrates de indeles pequeñas, haciéndolos
wellsuited para el estudio de la variación InDel.
Como se mencionó anteriormente, el inconveniente
ofshortreads (por debajo de about75 nt) obtenidos a
partir de Helicos, sólido, orGAinstrumentsisin
genomeassemblyand aplicaciones de mapas, donde
theplacementofrepeated orvery similarsequences no
se pueden resolver UNAMBIG-nuamente. La
colocación correcta se furthercomplicated por altas
tasas de error intro-ducing una distancia
requirementfora minimumsequence ofan
unambiguousplacement. -Extremo emparejado o de
yerba mate de par ayuda a favor de los protocolos
para superar algunos de theselimitations de corta lee
[65] por la información Provid-ción acerca de la
orientación relativa locationand
ofapairofreads.Currently un protocolo de extremo
emparejado se aplica onlycommonly en el GA,
whilemate-pairprotocolsareavailableforSOLiD, GS FLX
Titanium, y GA.Inpaired de fin de secuenciar el real
extremos
moléculas de ADN de más bien cortas (<1 kb)
aredetermined, whilemate-pairsequencing requiere la
preparación deOferta bibliotecas. En estos protocolos,
theends de moléculas más largas, tamaño
seleccionado (p.ej., 8, 12, o 20 kb) están conectados
withan secuencia adaptador interno en un circu-
larizationreaction.Thecircular
molécula se procesa a continuación, utilizando
enzimas restric-ción orfragmentation beforeouter
adaptadores biblioteca se añaden dos extremos del
aroundthe molécula combinada.
la
adaptador interno se puede entonces utilizar como
moléculas
additionalsequencingreactiononthesameimmobilized
una segunda sitio de cebado FORAN. Por lo tanto,
compañero-pairsequencingprovidesdistanceinfor-
mación usefulforassembly, butdoesnot permitir la
fusión de los dos se superpone a finales lee, ya que
por themolecules de diseño no se solaparán en
sequenc-ing.However, la fusión de los dos se
superponen-ping avance y retroceso endreads
pareadas de corto inserto bibliotecas allowsthe
reconstrucción OFA completa con-
secutivemoleculesequence, longerthan la longitud
individualread, ycon las tasas de error promedio de
reducción en theoverlapping secuencia de parte [60,
66].
Debido a las grandes cantidades de secuencial
ces creadas, hay interés en regiones seleccionadas
sequenc-ing (p.ej.agenomiclocus, desde
sequencecaptureexper-iments [67-69]) en múltiples
individuos / samplesinsteadofsequencingonesamplein
excessivedepth.Alltech-gías, por tanto, proporcionan
una placa separationoftheirsequencing en
definedregions o channels.However, como máximo, 16
tales regiones / canales están disponibles (GS FLX
Titanium y placas HeliScope), que, no tengan el
sufficientforsomeapplications. El uso de diferentes
bibliotecas con-structionprotocols, además
someplatformsallow de muestra de código de barras
específico (a veces llamado '' index '') secuencias enel
molecules.These biblioteca moleculescan entonces
besequenced en thesameregion / canal,
andlaterseparated (computacionalmente) theirbar
basa en la secuencia de código [70-73 ].
esto facilita
altamente parallelsequencing LargeNumber OFA de
las muestras más allá de que los possibleusing
(protocolos mostlynon proveedores) physicallane /
channelsepar-ation.Currently tales protocolos
disponibles forthe GS FLX Titanium, GA, y
SOLiDinstrument.
Aunque los precios de secuenciación por giga-
de base han disminuido considerablemente en los
últimos años a, haciendo Proyecto Genoma
projectslikethe1000Human Variación,
1001Arabidopsis thaliana Proyecto genomas,
theMammalianGenomeProject,
ortheInternationalCancerGenomeConsortium
posible, de alta throughputsequencing adquisición
stillhashigh, el funcionamiento y los costes de
mantenimiento,
cual
.....

no se incluyen en la Tabla 1. Además, eachof estas
plataformas requiere una managementandanalysis
datos substantialinvestmentin, tiempo y personal [74-
77] grupos de investigación .Smaller todavía puede
encontrar
prohibitivos los costos de la infrastructureneeded para
almacenar, manipular y ana-lizarla severaltens de
gigabytes de datos y terabytes de puresequence
varios
miles de archivos intermedios generados instrumentos
bythese cada semana. Incluso para
mayores, centros de genoma experimentados
thisaspect sigue siendo una cada vez mayores Chal-
lengefortheongoinguseoftheseplatforms.
próximas promociones
Motivado bythegoalofa $ 1.000 genoma Fijado por
el NIH / NHGRIto enablepersonalized la medicina,
los throughputofallsystems descrito es constante
y el aumento de los números dados
herearerapidlyoutdated.However, inaddition a las
mejoras de currenttechnologies,
includingtheJanuary2010
announcementoftheIlluminaHiSeq sistema de 2000,
que determinessequences de clusters en el fondo y
topof la celda de flujo y procesa dos celdas de flujo en
paralelo, una nueva generación ofsequencers ya está
en el horizonte.
WhatstartedwiththeHelicos
sistema - la secuencia de un solo mol-ecules sin
amplificación previa preparationor biblioteca -
probablemente se convierta en apopular paradigma.
En concreto, tres OT-sus sistemas han captado la
atención de medios andscientific WELLIN avance
oftheir
real Disponibilidad: Pacific
nanoporos Bioscience'sSingleMoleculeRealTime
(SMRT) sequencingtechnology [18], BASE-Technol gía
de Oxford nanoporos [14] y, recientemente, la
propuesta de IBM-ofsilicon basa [78].
PacificBiosciences'SMRT technologyperformsthe
reacción de secuenciación onsilicon dióxido de
chipswith un 100 nmmetalfilm
containingthousandsoftens-de-
nanometerdiameterholes, los llamados guías de onda
en modo cero (ZMWs) [79]. Cada ZMW se utiliza como
una cámara de nano-visual-ización, proporcionando un
detectionvolume de 20 zeptoliters (10
"21
l). en este
volumen, una sola molécula puede ser illu-minated
excluyendo otros labelednucleotides en el fondo -
savingtime y química de secuenciación por omitir-
ting etapas de lavado. Un ADN único polímero-asa
está fijada a la parte inferior de la
surfacewithinthedetectionvolume, andnucleotides,
con
differentdyes
unido a la cadena de fosfato,
areusedinconcentrationsallowingnormal
procesividad de la enzima. Como las pol-
ymeraseincorporatescomplementarynucleotides,
thenucleotideisheldwithin Fortens volumen de
detección
Tabla 1. Comparación de las tecnologías de secuenciación de alto rendimiento disponibles
rendimiento Longitud Calidad costos aplicaciones Las principales fuentes de errores
La tabla resume el rendimiento, la duración, la calidad y los costes para las versiones actuales de las tecnologías mencionadas. estos aproximada
los números están en constante mejora y en base a las cifras disponibles en enero de 2010. Los costos hacen instrumentacquisition notinclude y
mantenimiento; aún pueden verse afectados por los descuentos y los efectos de escala para múltiples instrumentos. Cuando los números son muy similares, colorsranging de rojo
rendimiento) a verde (buen rendimiento) indican una tendencia general. En la última columna, aplicaciones de ejemplo perfiles de error de ajuste thethroughputand ofeach Ofthe
plataformas son given.Typically, esto hace notmean thatthe tecnología se limita a theseapplications, pero que actualmente es el más adecuado para este tipo de aplicaciones.
þ
Alta profundidad secuenciación / número de pasadas requeridas.

ofmilliseconds, ordersofmagnitudelongerthan
forunspecificdiffusionevents. De esta manera el tinte
fluorescente
oftheincorporatednucleotidecanbeidentified durante
la síntesis normal de reversestrand velocidad [79] .En
pilotexper-iments, Pacific Biosciences tiene
shownthatitstechnology allowsfordirectsequencing
OFA pocos miles
basesbeforethepolymeraseisdenatureddue a la
lectura láser outofthe tecnología dyes.The SMRT está
destinado forrelease en 2010.Even aunque se
necesita furtherdevelopment para crear un
morerobustsystem, la omisión oflibrarypreparation y
amplificación así como seguir las secuencias largas
generadas
willundoubtedlyprovideanadvantageoverthecurrentsy
stemsformanyapplications.
BASE tecnología de Oxford nanoporos
es poco probable que sea lanzado pronto como
modificaciones
astheSMRTtechnology.BASEoffersthepotentialtoi
dentifyindividualnucleotide (p.ej.
5-metil-
citosinavs.cytosine) proceso duringthesequencing [14].
La idea behindthis tecnología es la
ofindividualnucleotides de identificación utilizando un
changein el potencial de membrana, ya que de paso a
través de una modificación una-hemolisina de poro
mem-brana con un sensor de ciclodextrina [14, 80]. Sin
embargo, la aplicación de este Technol-logía para la
secuenciación, el poro tiene que befused a una
exonucleasa, que degradessingle-
strandedDNAsequencesandreleases
individualnucleotides en thepore. Además, la
tecnología needsto ser paralelizado en formato de
matriz, beforeits liberación como un alto rendimiento
sequenc-ción platform.While la sensibilidad
forindividualnucleotidemodificationsseemsto ser un
majoradvantage,
thedestructivefashionoftheoutlinedsequencing proceso
podría ser forApplications considereda obstáculo con
muestras de pre-preciosas, y que no permite una
segunda ciclo de lectura para la reducción de error.
A principios de octubre de 2009, IBM emitió una
Comunicado de prensa [78] describe un método toslow
la velocidad ofan individualDNA cadena que pasa a
través de un nano-pore.For este fin developeda de
múltiples capas de metal / dieléctrico nanoporedevice
que utiliza la interacción de cargas theDNA columna
vertebral con un campo eléctrico RELAClONADAS-modu
para atrapar y slowlyreleases una tecnología
individualDNA molecule.The descrito podría Theor-
éticamente combinarse con, por ejemplo,
las tecnologías desarrolladas Nanopore atHarvard
Universidad [81] o la base previouslydescribed
technologywhereitmay superar la destructiva
approachfollowed hasta ahora.
Conclusión
Currenthigh-throughputsequencingtechnologies
proporcionan una gran variedad
ofsequencingapplicationstomanyresearchersandproje
cts.Giventheimmense la diversidad, hemos notdis-
terco estas aplicaciones en profundidad aquí, otras
opiniones con unas fuertes aplicaciones onspecific
focales y analysisare datos disponibles [24, 82-88].
Los discussedtechnologies hacen posible que
evensingle grupos de investigación para generar
largeamounts de muy rapidlyand atsubstantially
lowercosts
thantraditionalSangersequencing.Whilecosts se han
reducido a menos than4-0.1% y el tiempo ha sido un
factor de shortenedby 100-1.000 sobre la base de
datos de secuencias, dailythroughput
theerrorprofilesandlimitations observados para el plat
nuevas formas de differsignificantly
Sangersequencing y entre approaches.Further, cada
uno de estos nuevos sequencingplatforms requiere
additionalinvestments sustanciales - factores
thathave oftennot hacer hincapié suficiente en
researchpublications que describe una específica apli-
cation.Somevendorshaverecentlystarted para ofrecer
versiones de presupuesto de theirinstruments (p.ej.
Illumina GA IIe o 454 / Roche GS Junior) con
sequencingcapacity.However menor, precio
whiletheinstru-ment es más bajo, la financiera
invertirá-ment permanece high.Costs por base
aregenerally superior a la de la standardinstrument, y
verysimilaroverallinfrastructureisstillrequired.Oftenthe
elección de una adecuada sequencingplatform es
projectspecific y algunos
timescombinationscanbeadvan--
tageous.Thismayopen themarketfurtherto
companiesproviding
secuenciación-en-demandservices, butwill no
reemplaza la necesidad de laboratoriesto invertir un
tiempo considerable y exper-Tise tanto en la
producción de análisis librariesand Ofthe
vastquantities ofdata que se generará.
Las nuevas tecnologías en el horizonte,
SMRT por Pacific Biosciences, BASE byOxford
nanoporos, y othertechnol-gías como
thatsuggested por IBM,
demostrar el futuro importante directionsin el campo
de la secuenciación de ADN: el Abil-dad de usar
moléculas individuales withoutany preparación
biblioteca o la amplificación, la identificación de
nucleotidemodifications específicos, y la capacidad de
gener comió-secuencia más larga lee. Estos debuta
de desa- facilitarán futuras investigaciones inmany
campos, hacer más fácil el análisis de datos, y los
costos de secuenciación furtherreduce,
hopefullyachievingtheaim OFA $ 1.000 genoma
humano sugiere byNIH / NHGRI que se requiere para
la medicina-zado personal.
Expresiones de gratitud
Agradecemos a los miembros Ofthe Salida-
mentofEvolutionaryGenetics, los miembros de la
andparticularly sequencingGroup, forproviding
datafrommultipleplatforms de secuenciación,
aswellasinteresting usefulinsights.We discussionsand
también están en deuda con
A.Wilkinsandthethreeanonymousreviewersforcriticalr
eadingofthemanuscriptand thoughtfulcomments.This
trabajo fue apoyado por la Sociedad Max Planck.
referencias
1.Sanger F,GM aire,BarrellBG,et.1977.Nucleotide
secuencia de ADN ofbacteriophage phiX174. Naturaleza
265: 687-95.
2.Gilbert W,Maxam A.nucleotidesequence 1973.The del
operador lac. Proc Natl AcadSciUSA 70: 3581-4.
3.SangerF,Nicklen S,Coulson
AR.1977.DNAsequencingwithchain-
terminatinginhibitors.ProcNatlAcadSciUSA 74:
5463-7.
4.Sanger F, Coulson AR. 1975. Una rápida methodfor
determinar las secuencias en el ADN por primedsynthesis con
ADN polimerasa. J Mol Biol 94:
441-8.
5.Wu R, Kaiser AD. 1968. Estructura y basesequence en los
extremos cohesivos de ADN lambda-fago ofbacterio. J
MOLBIOL35: 523-37.
6.Smith LM,Sanders JZ,KaiserRJ,et.
detección 1986.Fluorescence en análisis de la secuencia
automatedDNA. Naturaleza 321: 674-9.
7.Swerdlow H,Gesteland
R.1990.Capillarygelelectrophoresis para la secuenciación
rápida resolutionDNA, alta.NucleicAcidsRes18:
1415-9.
8.Zagursky RJ,McCormick RM.1990.DNAsequencing
separaciones en geles capilares en amodified instrumento
de secuenciación de ADN comercial
ambiente. Biotechniques 9: 74-9.
9.Huang XC, Quesada MA, Mathies RA. 1992.DNA
secuenciación capilar usando matriz electro-foresis.
AnalChem 64: 2149-54.
10.Kambara H,TakahashiS.analizador de capillaryarrayDNA
1993.Multiple-sheathflow.
Naturaleza 361: 565-6.
.....

11.Ueno K,Yeung ES.fragmentos
1994.Simultaneousmonitoring ofDNA separados por
electroforesis en una matriz de multiplexado de
100capillaries. AnalChem 66: 1424-1431.
12.kimś,YooHJ,HahnJH.1996.Postelectrophoresiscapillary
exploración
secuenciación método forDNA.AnalChem68: 936-9.
13.Bentley DR, balasubramanian S,
SwerdlowHP,et.2008.Accuratewholehuman
la secuenciación del genoma usando la química termin
ator reversible. Naturaleza 456: 53-9.
14.Clarke J, Wu HC, Jayasinghe L, et al. identificación de la
base 2009.Continuous para single-mol
eculenanoporeDNAsequencing.NatNanotechnol4:
265-70.
15.Harris TD,Buzby PR,Babcock H,et.
La secuenciación del ADN de una sola molécula de 2008.
de aviralgenome. ciencia 320: 106-9.
dieciséis.Margulies M, Egholm M, WE Altman, et al.
2005. La secuenciación del genoma en microfabricatedhigh
densidad picolitros reactores.Naturaleza 437: 376-80.
17.Shendure J, Porreca GJ, REPPAS NB, et al.
2005. Accurate multiplex polony sequencingof un genoma
bacteriano evolucionado. ciencia 309: 1728-1732.
18.Korlach J, marcas PJ, Cicero RL, et al. pasivación de
aluminio para 2008.Selective dirigida
inmovilización de ADN polimerasa MOL-ecules individuales
en cero en modo de guía de ondas nanostruc-turas. Proc
NatlAcad SciUSA 105: 1176-1181.
19.Ansorge WJ.2009.Next generación, técnicas de
Secuenciación del ADN.NatBiotechnol25:
195-203.
20.MardisER.2008.Next generación, métodos
Secuenciación del ADN.Annu Rev Genómica
Hum Genet 9: 387-402.
21.Schuster CAROLINA DEL SUR.2008.Next generación
secuenciación transforma la biología de
hoy.NatMethods 5: 16-8.
22.Shendure J,JIH.2008.Next generación, la secuenciación
del ADN.NatBiotechnol26: 1135-
45.
23.Shendure JA,Porreca GJ, Iglesia GM.
2008.Overview ofDNA secuenciación Strat-tegias.Curr
protoc MOLBIOLCapítulo 7: Unidad
7.1.
24.Metzker ML. 2010. Las tecnologías de secuenciación
- la próxima generación. Nat Rev Genet 11: 31-
46.
25.George KS, Zhao X, Gallahan D, et al.
1997.Capillaryelectrophoresismethodologyfor
identificación de genes relacionados con el cáncer patrones
expre-sión de reacción en cadena de displaypolymerase
diferencial fluorescente.J Chromatogr BBiomed SciAppl695:
93-102.
26.BlazejRG,P Kumaresan,MathiesRA.
2006.Microfabricated bioprocessor para inte-rallado
nanolitros escala de ADN Sanger sequenc-ción. Proc
NatlAcad SciUSA 103: 7240-5.
27.Mariella R Jr. 2008. Preparación de la muestra: theweak
eslabón de bio-detección basada en la microfluídica.
Microdispositivos Biomed 10: 777-84.
28.Roper MG,Easley CJ,Legendre LA,et al.
2007. sistema de control de temperatura por infrarrojos fora
chainreaction completamente noncontactpolymerase en
chips de microfluidos.AnalChem79: 1294-1300.
29.Emrich CA, Tian H, Medintz IL, et al.
2002.Microfabricated 384 carriles conjunto de capilares
elec-
Bioanalyzer trophoresis para el análisis de ultra-alta-a
través putgenetic.AnalChem 74: 5076-
83.
30.Shibata K,Itoh M,Aizawa K,et.2000.RIKEN Análisis de la
secuencia integrada (RISA)
sistema - 384 formato de la tubería con la secuenciación
384 secuenciador multicapilar.Genome Res10: 1757-
1771.
31.HertDG,Fredlake CP,Barron AE.2008.Advantages y
limitaciones ofnext-generación
tecnologías de secuenciación ación: a
comparisonofelectrophoresis y no electrophoresismethods.
electroforesis 29: 4618-26.
32.Ewing B,Hillier L,WendlMC,et.1998.Base Insultos de
trazas secuenciador automático
usingphred.I.Accuracyassessment.Genome Res 8:
175-85.
33.Ewing B,P. Verde1998.Base-llamando sequencertraces
ofautomated utilizando Phred.
II.Errorprobabilities.GenomeRes8: 186-94.
34.RonaghiM,Karamohamed S,Pettersson
segundo,etTiempo de liberación .1996.Real
ofpyrophosphate detección sequencingusing
ADN.AnalBiochem 242: 84-9.
35.Quinlan AR,StewartDA,Stromberg
MP,et.2008.Pyrobayes: Una base mejorada
descubrimiento callerforSNP en
pyrosequences.Métodos Nat 5: 179-81.
36.T mimbre, E Schlagenhauf, Un Graner, et al.
2006. 454 secuenciación puso a prueba utilizando
thecomplex genoma de la cebada. BMC Genomics 7:
275.
37.RE verde, Malaspina AS, Krause J, et al.
2008. Una completa
Neandertalmitochondrialgenomesequencedetermined
byhigh-throughputsequencing.Celda134: 416-
26.
38.RE verde,Krause J,Ptak
SE,et.2006.Analysisofonemillionbasepairsof
NeanderthalDNA. Naturaleza 444: 330-6.
39.TurcattiG,Un romieu,Fedurco M,et.
2008. Una nueva clase fluorescentnucleotides
ofcleavable: síntesis y optimización de síntesis
terminadores asreversible sequencingby forDNA.
Nucleic Acids Res 36: E25.
40.Fedurco M,Un romieu,Williams S,et.
2006.BTA, un novelreagent para el ADN adjuntar-menton
vidrio y colonias de ADN amplificados efficientgeneration
fase ofsolid. NucleicAcids Res 34: E22.
41.KircherM,StenzelU,KelsoJ.aprendizaje automático
2009.ImprovedbasecallingfortheIlluminaGenome
Analyzerusing
estrategias. Biol genoma10: R83.
42.Dohm JC, Lottaz C, Borodina T, et al.
2008.Substantialbiases de datos ultra-shortread
establece a partir de la secuenciación de ADN de alto
rendimiento.Nucleic Acids Res 36: E105.
43.Y Erlich,Mitra PP,delaBastide M,et.
2008.Alta-cíclica: la secuenciación Aself-
optimizingbasecallerfornext generación.NatMethods
5: 679-82.
44.RougemontJ,Un Amzallag,IseliC,et.
2008.Probabilistic base de datos llamando
ofSolexasequencing. BMC Bioinf. 9: 431.
45.R Drmanac,Sparks AB,Callow MJ,et.
2010.Humangenomesequencingusingunchained
readson base de nanoarrays auto-assemblingDNA.
ciencia 327: 78-81.
46.Applied Biosystems. UN Teórico
Comprensión de2 Base colorcodes andits
Aplicación a Anotación, error
Detección, andErrorCorrection.WhitePaper
SóLIdASTMSistema; 2008.
47.Dimalanta ET,Zhang L,Hendrickson
CL,et.2009.Increased Leer longitud en el
SólidoTMSequencingPlatform.PosterSOLiDTMSistema.
48.ZhuZ,WaggonerAS.1997.Molecularmechanism el control
de la incorporación de
fluorescentnucleotides en el ADN por PCR.citometría
28: 206-11.
49.Bowers J,MitchellJ,cerveza
E,et.2009.Virtualterminatornucleotidesfornext-
la secuenciación del ADN generación.NatMethods6:
593-5.
50.Pushkarev D,NeffNF,SR terremoto.2009.Single
secuenciación de moléculas individuales ofan
Genoma humano. Nat Biotechnol 27: 847-52.
51.Reinhardt JA,Baltrus DA,Nishimura MT,et al. conjunto de
2009. De novo usando bajo tura
tura datos de la secuencia corta leídos del ricepathogen
Pseudomonas syringae pv. oryzae.Genome Res 19: 294-
305.
52.DiguistiniS,Liao NY,Platt D,et.2009.De Novo secuencia
del genoma de montaje OFA
hongo filamentoso utilizando Sanger, 454 datos de
secuencia andIllumina.Biol genoma10: R94.
53.Miller JR, Delcher AL, Koren S, et al.
2008.Aggressiveassemblyofpyrosequencing
lee con compañeros.bioinformática 24: 2818-
24.
54.Chen W, R Ullmann, Langnick C, et al. análisis
2009.Breakpoint del cromosoma equilibrada
reordenamientos de secuenciación de próxima generación
de extremo emparejado.Eur J Hum GenetDol: 10.1038 / ejhg
.2009.21118 [Epub ahead of print].
55.Zimin AV, Delcher AL, Florea L, et al. 2009.A ensamblaje
del genoma completo Ofthe doméstica
vaca, Bos taurus. Biol genoma10: R42.
56.Zhou X,Su Z,Sammons RD,et.2009.Novelsoftware
Paquete forcross-platformtranscriptomeanalysis
(CPTRA).BMC
Bioinf. 11: S16.
57.Kim JI, Ju YS, parque H, et al. 2009. Un
highlyannotatedwhole-genomesequenceofa
Corea del individuo. Naturaleza 460: 1011-5.
58.Linsen SE, de Wit E, Janssens G, et al. 2009.Limitations y
posibilidades ofsmallRNA
digitalgeneexpressionprofiling.NatMethods 6: 474-6.
59.QuailMA,Swerdlow H,Turner DJ.2009.Improved
protocolos para la Illumina Genoma
Analyzersequencing sistema.CurrProtocHum Genet
Capítulo 18: Unidad de 18.2.
60.Briggs AW, Stenzel U, Meyer M, et al. 2009.Removal de
citosinas deaminados y detección
ción deen vivo metilación en ancientDNA.Nucleic
Acids Res 38(6): e87 [Epub aheadof de impresión].
61.T Maricic,Pääbo S.2009.Optimization of454 preparación
biblioteca de secuenciación de pequeños
cantidades de ADN permite secuencia de determi-nación
ofboth cadenas de ADN.Biotechniques46: 51-2, 54-7.
62.N Rohland, Horfreiter M.2007. Comparisonand extracción
de optimización ofancientDNA.
Biotechniques 42: 343-52.
63.Wheeler DA, Srinivasan M, Egholm M, et al.
2008. El genoma completo de un individualby secuenciación
del ADN masivamente paralelo. Naturaleza452: 872-6.
64.O Harismendy, PC ng, Strausberg RL, et al.
2009. Evaluación de los estudios sequenc-
ingplatformsforpopulationtargetedsequencing de próxima
generación. Biol genoma10: R32.
sesenta y cinco.Chaisson MJ, Brinza D, Pevzner PA.
ensamblaje fragmento de novo con 2009.De corta mate-
emparejado lee: ¿Es importante la longitud de leer?
Genome Res 19: 336-46.
66.Krause J, Briggs AW, Kircher M, et al. 2009.A ADNmt
genoma completo de un mo- temprana
ern humana de Kostenki, Rusia.Curr Biol20: 231-6.
67.Un Gnirke, Un Melnikov, Maguire J, et al. 2009.Solution
selección de híbridos con oli- ultra-larga
gonucleotides para masivamente paralelo dirigida
secuenciación. Nat Biotechnol27: 182-9.

68.Hodges E,Rooks M,Xuan Z,etla selección de los
intervalos de .2009.Hybrid genómicas discretas
en microarrays de diseño personalizado Formas-
sivelyparallelsequencing.NatProtoc4: 960-74.
69.Briggs AW, bueno JM, RE verde, et al.
2009.Targetedretrievalandanalysisoffive
NeandertalmtDNA genomas.ciencia 325: 318-21.
70.MeyerM,StenzelU,HofreiterM.secuenciación
2008.Paralleltagged en la plataforma 454
formar. Nat protoc 3: 267-78.
71.Meyer M,StenzelU,Myles S,et.2007.Targetedhigh-
Throughputsequencingof
etiquetados muestras de ácidos nucleicos.AcidsRes
nucleicos 35: E97.
72.Y Erlich,Chang K,A Gordon,et.2009.DNA Sudoku - el
aprovechamiento de alto rendimiento
secuenciación de muestras multiplexadas Analy-sis.
Genome Res 19: 1243-1253.
73.Meyer M, Kircher M. 2010. Illumina sequenc-ing preparación
para la biblioteca altamente multiplexados
orientar la captura y secuenciación.Fría SpringHarb
protoc DOI: 10.1101 / pdb.prot5448.
74.pop M,Salzberg SL.2008.Bioinformaticschallenges ofnew
tecnología de secuenciación.
Trends Genet 24: 142-9.
75.Richter BG, Sexton DP. 2009. La gestión de
andanalyzingnext-generationsequencedata.
PLoS Comput Biol5: E1000369.
76.codornices MA, me Kozarewa, Smith F, et al. mejoras de
2008. Una gran centro al genoma
sistema de secuenciación de Illumina. Métodos Nat 5:
1005-1010.
77.BatleyJ,EdwardsD.2009.Genomesequence datos:
gestión, almacenamiento, andvisualization. Biotechniques
46: 333-4, 336.
la investigación tiene como objetivo 78.IBM
Research.2009.IBM tobuild secuenciador de ADN para
ayudar a nanoescala unidad
costos bajos de análisis genético personalizado. InLoughran
M, ed .; Notas de prensa, Vol. 2009.new York: IBM.
79.Eid J, Un Fehr, Gray J, et al. 2009. Real-timeDNA
secuenciación de una sola moles polimerasa
ecules. ciencia 323: 133-8.
80.Y Astier, O Braha, Bayley H. 2006.
TowardsinglemoleculeDNAsequencing: directa
ofribonucleoside identificación y deoxyri-bonucleoside
50-monophosphates por usingan ingeniería de
proteínas nanoporos EQUIPPEDWITH un
molecularadapter.Soc J Am Chem128: 1705-1710.
81.Albertorio F, Hughes ME, Golovchenko JA,et.2009.Base
DependentDNA-carbono
interacciones de nanotubos: la activación
enthalpiesand montaje disassemblycontrol.Nano-
tecnología 20: 395.101.
82.Medvedev P,Stanciu M,Brudno
M.2009.Computationalmethodsfordiscovering
structuralvariationwithnext-generationsequencing.
Métodos Nat 6: S13-20.
83.PepkeS,Wold B,MortazaviA.2009.ComputationforChIP-
seqandRNA-seqstudies. Métodos Nat 6: S22-32.
84.FlicekP,BirneyE.2009.Sensefromsequence lee: métodos
de alineación y
Asamblea. Métodos Nat 6: S6-12.
85.Parque PJ.2009.ChIP-ss: ventajas andchallengesofa
tecnología de maduración.Nat
Rev Genet 10: 669-80.
86.WallPK,Leebens-J Mack,ChanderbaliAS, et al. 2009.
Comparación de la próxima generación
sequencingtechnologiesfortranscriptomecharacterizatio
n. BMC Genomics 10: 347.
87.Holt RA, SJ Jones. 2008. La nueva secuenciación celda de
flujo paradigmof. Genome Res 18: 839-
46.
88.DalcaAV,BrudnoM.2010.Genomevariationdiscoverywith
high rendimiento
los datos de secuenciación. Breve Bioinf. 11: 3-14.
.....

D912f51131ed787b91.en.es

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a D912f51131ed787b91.en.es

Similar a D912f51131ed787b91.en.es (20)

Último

Último (20)

D912f51131ed787b91.en.es