SlideShare una empresa de Scribd logo
1 de 42
Secuenciación, Limpieza de
Datos y Ensamblaje
Genomas
Genomas Secuenciados
Organismo Proyectos Genoma
Virus 1419
Eubacteria 178
Archea 16
Eucariotes 64
Plantas 7
Hongos 21
Invertebrados 26
Vertebrados 10
Escherichia coli
E. coli Total proteínas
35%
65%
Desconocido Conocido
E.coli COGS
26%
0%
0%
0%
5%
1%
6%
2%
7%
2%
2%
3%
5%
6%
5%
2%
3%
4%
1%
7%
8%
3%
1%
1%
Mycobacterium tuberculosis
M. tuberculosis
62%
38%
Hipotéticas Conocidas
M. tuberculosis COGS
0%
0% 5% 1%
5%
2%
3%
3%
6%
4%
4%
5%
3%
1%
2%
3%
5%
3%
9%
5%
33%
Para Secuenciar un genoma
• Fred Sanger (1977)
• Mejoras en últimos 10 años
– Polimerasas termoestables
– Instrumentos basados en capilares (500-800pb de
alta calidad)
– Mejores detecciones fluorescentes.
– Robots para subclonajes purificaciones,
subclonaciones, etc.
Estrategias
Clone by Clone shotgun
• Estrategia: “Mapear primero, secuenciar
después”
• Construcción del mapa:
– DNA genómico se clona en BAC’s, PAC’s(100-
200kb) o YAC’s (1Mb)
– De cada BAC se toman “fingerprints” basados en
restricciones.
– Se usan para determinar regiones sobrelapadas y
ensamblar los contigs
– Se usan otros marcadores para el mapeo para
ubicar los BAC en el genoma.
Clone by Clone shotgun
• Clones que se sobrelapan mínimamente son
seleccionados para secuenciación
• Para cada BAC seleccionado el fragmento es
purificado y fragmentado  son sub-clonados.
• Se seleccionan algunos de manera aleatoria y se
secuencian.
• A través de computadores y herramientas
bioinformáticas se ensamblan las secuencias en
contigs.
• Se chequea una vez terminada para observar que
los resultados con marcadores y enzimas de
restricción se sigan obteniendo.
Whole-genome shotgun
sequencing
• Se generan secuencias aleatorias a lo
largo de todo el genoma.
• Requiere que se hagan muchas copias
para asegurar que se cubre todo el
genoma.
• No necesita un mapa físico anterior.
Generación de Secuencias
Traducción de Cromatogramas
Remover contaminación de Vectores
Enmascaramiento de repeticiones
Agrupamiento (Clustering)
Ensamblaje
Generación de Secuencias
• Marcar los fragmentos con colorantes
fluorescentes.
• Electroforesis (Geles o Capilares)
• Capilares: Detección por láser
• Convertir las mediciones en secuencia
• Problemas:
– Generalmente primeros 50 nuc. no son tan
confiables, hay ruido y los picos no están bien
separados
– Depende de factores como la calidad de la
secuencia o la afinidad y calidad de la polimerasa
usada.
Metodo Dideoxy
Traducción de Cromatograma
Hay varios programas, entre ellos:
• Phred (Ewig et al., 98);
• ABI (Connell et al., 87);
• Sax (Berno, 95);
• A base-calling library (Giddings et al.,
93);
Phred
Genome Research 8: 175-185, 1998
Phred
1. Lee cromatogramas – compatible con la mayoria
de formatos: SCF (standard chromatogram format),
ABI (373/377/3700), ESD (MegaBACE) and LI-
COR.
2. “Base calling” – A cada pico asigna un nucleotido
especifico, con menor probabilidad de error que
otros programas.
Phred
3. Asigna valores de calidad a cada base – un “Phred
value” basado en una estimacion del error para
cada base.
4. Crea archivos de salida – aparecen los
nucleotidos, valores de calidad y posicion de cada
pico respecto al origen.
Phd file
BEGIN_SEQUENCE
01EBV10201A02.g
BEGIN_COMMENT
CHROMAT_FILE: EBV10201A02.g
ABI_THUMBPRINT:
PHRED_VERSION: 0.990722.g
CALL_METHOD: phred
QUALITY_LEVELS:99
TIME: Thu May 24 00:18:58 2001
TRACE_ARRAY_MIN_INDEX: 0
TRACE_ARRAY_MAX_INDEX: 12153
TRIM:
CHEM: term
DYE: big
END_COMMENT
BEGIN_DNA
t 8 5
c 13 17
a 19 26
c 19 32
t 24 2221
a 24 2232
a 22 2245
a 27 2261
g 25 2272
c 19 2286
c 12 2302
t 19 2314
g 12 2324
g 15 2331
g 19 2346
g 23 2363
t 33 2378
g 36 2390
c 44 2404
c 44 2419
END_DNA
END_SEQUEN
CE
Limpieza de Contaminación por
Vectores
• Eliminar regiones 5’ y 3’ que corresponden a los
vectores y adaptadores usados para la
secuenciación.
• Contaminación: De Bacterias, Levaduras.
• Se usan programas tipo Blast que realizan
alineamientos pareados contra bases de datos de
vectores. UniVec es una base de datos no
redundante en el NCBI
http://www.ncbi.nlm.nih.gov/VecScreen/UniVec.html
• VecScreen (http://www.ncbi.nlm.nih.gov/VecScreen)
Enmascaramiento de
Repeticiones
• Deben ser enmascarados no eliminados porque
también causaría un mal ensamblaje. Interesante para
ciertos estudios evolutivos y para el mapeo de
enfermedades.
• También se puede enmascarar el DNA ribosomal.
• Herramientas:
– Repeat masker: Diseñado para encontrar elementos
repetitivos y secuencias de baja complejidad.
http://repeatmasker.genome.washington.edu/cgi-
bin/RepeatMasker
– MaskerAid: Usando otro algoritmo (WU-Blast) para
alineamientos es 30 veces mejor que repeat Masker.
http://sapiens.wustl.edu/maskeraid
Gran Numero de Repeticiones
Ensamblaje y Procesamiento
• Reconstrucción de la secuencia original a partir de
los subfragmentos.
• Puede generar mas de 1 secuencia.
• Phrap ampliamente usado para secuencias
genómicas
• Otros disponibles:
– CAP3, TIGR Assembler.
Phrap
Phragment Assembly Program
Es un programa para ensamblar fragmentos
“Shotgun”
Phrap
Caracteristicas:
a. Usa las entradas completas (Salidas de Phred) (No necesita
editarlas)
b. No genera un conscenso!! El Contig es constituido por un
mosaico de los segmentos de mayor calidad de las lecturas.
c. En los diferentes archivos de salida da diferentes
características de los alineamientos como la calidad de estos.
d. Maneja facilmente gran cantidad de datos (Cientos de miles).
Algoritmo de Phrap
1) Lee la secuencia y los valores de calidad, genera los
complementos.
2) Busca palabras homólogas y elimina secuencias
idénticas.
3) Busca contaminación por vectores y enmascara.
4) Busca secuencias casi idénticas y con “self-matching”
4) Encuentra “matches” de 2 secuencias y se confirman
según la calidad de las lecturas.
6) Calcula un puntaje para los “matches”.
7) Encuentra el mejor alineamiento para cada pareja con
“match”
8) Con los alineamientos, se arman los contigs de mayor
a menor puntaje.
Algoritmo de Phrap
Archivos de salida de Phrap
• *.contigs – Contigs en formato Fasta
• *.singlets – “Singlets” en formato Fasta
• *.ace – Archivo para correr el Consed
• *.view – Requerido para ver en el PhrapView
Consed
Programa para ver y editar los ensamblajes.
Características:
a. Assembly viewer - Permite ver los contigs como alineamientos
múltiples de las secuencias.
b. Trace file viewer – Permite ver y comparar los cromatogramas de
las diferentes secuencias alineadas.
c. Navigation – Da características de las secuencias, como
regiones de baja calidad o inconsistencias.
Consed
Consed
Consed
Consed
Consed
Problemas en ensamblaje
A
B
C
B
Secuencias Genoma.ppt

Más contenido relacionado

Similar a Secuencias Genoma.ppt

Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionoxaljayos1
 
Practica 1 analisis de secuencias del gen16 s
Practica 1   analisis de secuencias del gen16 s Practica 1   analisis de secuencias del gen16 s
Practica 1 analisis de secuencias del gen16 s KarenOriflame
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genéticamerchealari
 
Secuenciación de ADN
Secuenciación de ADNSecuenciación de ADN
Secuenciación de ADNRai Encalada
 
Valeria ampuero practica n°2
Valeria ampuero practica n°2Valeria ampuero practica n°2
Valeria ampuero practica n°2ValeriaAmpuero4
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispeleticiamorales38
 
Las multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaLas multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaAlberto Labarga
 
Informe biotecnologia SnapGene
Informe biotecnologia SnapGeneInforme biotecnologia SnapGene
Informe biotecnologia SnapGeneValeriaAmpuero5
 
Estructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfEstructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfDouglasGalvis1
 
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.Alberto Labarga
 
Informe 1 biotecnologia- anyulia torres sosa
Informe 1  biotecnologia- anyulia torres sosaInforme 1  biotecnologia- anyulia torres sosa
Informe 1 biotecnologia- anyulia torres sosaAnyuliaTorresSosa
 
BIOINFORMATICA (2).pptx
BIOINFORMATICA (2).pptxBIOINFORMATICA (2).pptx
BIOINFORMATICA (2).pptxFernandoGc16
 
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...StefaniBrillyArevalo
 
Tema 16: El ADN y la ingeniería genética
Tema 16: El ADN y la ingeniería genéticaTema 16: El ADN y la ingeniería genética
Tema 16: El ADN y la ingeniería genéticaEduardo Gómez
 
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesMétodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesBiocientificaSA
 

Similar a Secuencias Genoma.ppt (20)

Secuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacionSecuenciaciondegenomas.pdfSecsuenciacion
Secuenciaciondegenomas.pdfSecsuenciacion
 
Practica 1 analisis de secuencias del gen16 s
Practica 1   analisis de secuencias del gen16 s Practica 1   analisis de secuencias del gen16 s
Practica 1 analisis de secuencias del gen16 s
 
Biochips
BiochipsBiochips
Biochips
 
Biochips
BiochipsBiochips
Biochips
 
Ingeniería genética
Ingeniería genéticaIngeniería genética
Ingeniería genética
 
Secuenciación de ADN
Secuenciación de ADNSecuenciación de ADN
Secuenciación de ADN
 
Valeria ampuero practica n°2
Valeria ampuero practica n°2Valeria ampuero practica n°2
Valeria ampuero practica n°2
 
Curso de Genómica - UAT (VHIR) 2012 - Microarrays
Curso de Genómica - UAT (VHIR) 2012 - MicroarraysCurso de Genómica - UAT (VHIR) 2012 - Microarrays
Curso de Genómica - UAT (VHIR) 2012 - Microarrays
 
Leticia ines morales quispe
Leticia ines morales quispeLeticia ines morales quispe
Leticia ines morales quispe
 
Las multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaLas multiples caras de la bioinformatica
Las multiples caras de la bioinformatica
 
Informe biotecnologia SnapGene
Informe biotecnologia SnapGeneInforme biotecnologia SnapGene
Informe biotecnologia SnapGene
 
Pcr convencional
Pcr convencionalPcr convencional
Pcr convencional
 
Estructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdfEstructura y definición del genoma humano .pdf
Estructura y definición del genoma humano .pdf
 
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.
Inteligencia Artificial en Bioinformática. Algunas Aplicaciones.
 
Informe 1 biotecnologia- anyulia torres sosa
Informe 1  biotecnologia- anyulia torres sosaInforme 1  biotecnologia- anyulia torres sosa
Informe 1 biotecnologia- anyulia torres sosa
 
BIOINFORMATICA (2).pptx
BIOINFORMATICA (2).pptxBIOINFORMATICA (2).pptx
BIOINFORMATICA (2).pptx
 
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...
INFORME DE LA PRACTICA N 04 ANALISIS DE SECUENCIAS DE ADN Y USO DEL BANCO DE ...
 
Tema 16: El ADN y la ingeniería genética
Tema 16: El ADN y la ingeniería genéticaTema 16: El ADN y la ingeniería genética
Tema 16: El ADN y la ingeniería genética
 
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. AplicacionesMétodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
 
Informe de bio filogenia
Informe de bio filogeniaInforme de bio filogenia
Informe de bio filogenia
 

Más de David Rosales

BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.ppt
BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.pptBIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.ppt
BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.pptDavid Rosales
 
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.ppt
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.pptUTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.ppt
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.pptDavid Rosales
 
Promoter tools for further development of Aspergillus oryzae.pptx
Promoter tools for further development of Aspergillus oryzae.pptxPromoter tools for further development of Aspergillus oryzae.pptx
Promoter tools for further development of Aspergillus oryzae.pptxDavid Rosales
 
Técnicas en biología.pptx
Técnicas en biología.pptxTécnicas en biología.pptx
Técnicas en biología.pptxDavid Rosales
 
teoría 10. biomoleculas.pptx
teoría 10. biomoleculas.pptxteoría 10. biomoleculas.pptx
teoría 10. biomoleculas.pptxDavid Rosales
 
SEM_TEORIA_REPLICACION_DEL_ADN.pptx
SEM_TEORIA_REPLICACION_DEL_ADN.pptxSEM_TEORIA_REPLICACION_DEL_ADN.pptx
SEM_TEORIA_REPLICACION_DEL_ADN.pptxDavid Rosales
 

Más de David Rosales (6)

BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.ppt
BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.pptBIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.ppt
BIOINFORMÁTICA Fundamentos y aplicaciones de actualidad.ppt
 
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.ppt
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.pptUTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.ppt
UTILIZACIÓN DE ANTICUERPOS EN BIOMEDICINA.ppt
 
Promoter tools for further development of Aspergillus oryzae.pptx
Promoter tools for further development of Aspergillus oryzae.pptxPromoter tools for further development of Aspergillus oryzae.pptx
Promoter tools for further development of Aspergillus oryzae.pptx
 
Técnicas en biología.pptx
Técnicas en biología.pptxTécnicas en biología.pptx
Técnicas en biología.pptx
 
teoría 10. biomoleculas.pptx
teoría 10. biomoleculas.pptxteoría 10. biomoleculas.pptx
teoría 10. biomoleculas.pptx
 
SEM_TEORIA_REPLICACION_DEL_ADN.pptx
SEM_TEORIA_REPLICACION_DEL_ADN.pptxSEM_TEORIA_REPLICACION_DEL_ADN.pptx
SEM_TEORIA_REPLICACION_DEL_ADN.pptx
 

Último

Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffJefersonBazalloCarri1
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 

Último (20)

Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffff
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 

Secuencias Genoma.ppt

  • 1. Secuenciación, Limpieza de Datos y Ensamblaje Genomas
  • 2. Genomas Secuenciados Organismo Proyectos Genoma Virus 1419 Eubacteria 178 Archea 16 Eucariotes 64 Plantas 7 Hongos 21 Invertebrados 26 Vertebrados 10
  • 3. Escherichia coli E. coli Total proteínas 35% 65% Desconocido Conocido E.coli COGS 26% 0% 0% 0% 5% 1% 6% 2% 7% 2% 2% 3% 5% 6% 5% 2% 3% 4% 1% 7% 8% 3% 1% 1%
  • 4. Mycobacterium tuberculosis M. tuberculosis 62% 38% Hipotéticas Conocidas M. tuberculosis COGS 0% 0% 5% 1% 5% 2% 3% 3% 6% 4% 4% 5% 3% 1% 2% 3% 5% 3% 9% 5% 33%
  • 5.
  • 6. Para Secuenciar un genoma • Fred Sanger (1977) • Mejoras en últimos 10 años – Polimerasas termoestables – Instrumentos basados en capilares (500-800pb de alta calidad) – Mejores detecciones fluorescentes. – Robots para subclonajes purificaciones, subclonaciones, etc.
  • 8. Clone by Clone shotgun • Estrategia: “Mapear primero, secuenciar después” • Construcción del mapa: – DNA genómico se clona en BAC’s, PAC’s(100- 200kb) o YAC’s (1Mb) – De cada BAC se toman “fingerprints” basados en restricciones. – Se usan para determinar regiones sobrelapadas y ensamblar los contigs – Se usan otros marcadores para el mapeo para ubicar los BAC en el genoma.
  • 9. Clone by Clone shotgun • Clones que se sobrelapan mínimamente son seleccionados para secuenciación • Para cada BAC seleccionado el fragmento es purificado y fragmentado  son sub-clonados. • Se seleccionan algunos de manera aleatoria y se secuencian. • A través de computadores y herramientas bioinformáticas se ensamblan las secuencias en contigs. • Se chequea una vez terminada para observar que los resultados con marcadores y enzimas de restricción se sigan obteniendo.
  • 10.
  • 11. Whole-genome shotgun sequencing • Se generan secuencias aleatorias a lo largo de todo el genoma. • Requiere que se hagan muchas copias para asegurar que se cubre todo el genoma. • No necesita un mapa físico anterior.
  • 12.
  • 13. Generación de Secuencias Traducción de Cromatogramas Remover contaminación de Vectores Enmascaramiento de repeticiones Agrupamiento (Clustering) Ensamblaje
  • 14. Generación de Secuencias • Marcar los fragmentos con colorantes fluorescentes. • Electroforesis (Geles o Capilares) • Capilares: Detección por láser • Convertir las mediciones en secuencia • Problemas: – Generalmente primeros 50 nuc. no son tan confiables, hay ruido y los picos no están bien separados – Depende de factores como la calidad de la secuencia o la afinidad y calidad de la polimerasa usada.
  • 16.
  • 17.
  • 18.
  • 19. Traducción de Cromatograma Hay varios programas, entre ellos: • Phred (Ewig et al., 98); • ABI (Connell et al., 87); • Sax (Berno, 95); • A base-calling library (Giddings et al., 93);
  • 20. Phred Genome Research 8: 175-185, 1998
  • 21. Phred 1. Lee cromatogramas – compatible con la mayoria de formatos: SCF (standard chromatogram format), ABI (373/377/3700), ESD (MegaBACE) and LI- COR. 2. “Base calling” – A cada pico asigna un nucleotido especifico, con menor probabilidad de error que otros programas.
  • 22. Phred 3. Asigna valores de calidad a cada base – un “Phred value” basado en una estimacion del error para cada base. 4. Crea archivos de salida – aparecen los nucleotidos, valores de calidad y posicion de cada pico respecto al origen.
  • 23. Phd file BEGIN_SEQUENCE 01EBV10201A02.g BEGIN_COMMENT CHROMAT_FILE: EBV10201A02.g ABI_THUMBPRINT: PHRED_VERSION: 0.990722.g CALL_METHOD: phred QUALITY_LEVELS:99 TIME: Thu May 24 00:18:58 2001 TRACE_ARRAY_MIN_INDEX: 0 TRACE_ARRAY_MAX_INDEX: 12153 TRIM: CHEM: term DYE: big END_COMMENT BEGIN_DNA t 8 5 c 13 17 a 19 26 c 19 32 t 24 2221 a 24 2232 a 22 2245 a 27 2261 g 25 2272 c 19 2286 c 12 2302 t 19 2314 g 12 2324 g 15 2331 g 19 2346 g 23 2363 t 33 2378 g 36 2390 c 44 2404 c 44 2419 END_DNA END_SEQUEN CE
  • 24. Limpieza de Contaminación por Vectores • Eliminar regiones 5’ y 3’ que corresponden a los vectores y adaptadores usados para la secuenciación. • Contaminación: De Bacterias, Levaduras. • Se usan programas tipo Blast que realizan alineamientos pareados contra bases de datos de vectores. UniVec es una base de datos no redundante en el NCBI http://www.ncbi.nlm.nih.gov/VecScreen/UniVec.html • VecScreen (http://www.ncbi.nlm.nih.gov/VecScreen)
  • 25.
  • 26. Enmascaramiento de Repeticiones • Deben ser enmascarados no eliminados porque también causaría un mal ensamblaje. Interesante para ciertos estudios evolutivos y para el mapeo de enfermedades. • También se puede enmascarar el DNA ribosomal. • Herramientas: – Repeat masker: Diseñado para encontrar elementos repetitivos y secuencias de baja complejidad. http://repeatmasker.genome.washington.edu/cgi- bin/RepeatMasker – MaskerAid: Usando otro algoritmo (WU-Blast) para alineamientos es 30 veces mejor que repeat Masker. http://sapiens.wustl.edu/maskeraid
  • 27. Gran Numero de Repeticiones
  • 28.
  • 29. Ensamblaje y Procesamiento • Reconstrucción de la secuencia original a partir de los subfragmentos. • Puede generar mas de 1 secuencia. • Phrap ampliamente usado para secuencias genómicas • Otros disponibles: – CAP3, TIGR Assembler.
  • 30. Phrap Phragment Assembly Program Es un programa para ensamblar fragmentos “Shotgun”
  • 31. Phrap Caracteristicas: a. Usa las entradas completas (Salidas de Phred) (No necesita editarlas) b. No genera un conscenso!! El Contig es constituido por un mosaico de los segmentos de mayor calidad de las lecturas. c. En los diferentes archivos de salida da diferentes características de los alineamientos como la calidad de estos. d. Maneja facilmente gran cantidad de datos (Cientos de miles).
  • 32. Algoritmo de Phrap 1) Lee la secuencia y los valores de calidad, genera los complementos. 2) Busca palabras homólogas y elimina secuencias idénticas. 3) Busca contaminación por vectores y enmascara. 4) Busca secuencias casi idénticas y con “self-matching”
  • 33. 4) Encuentra “matches” de 2 secuencias y se confirman según la calidad de las lecturas. 6) Calcula un puntaje para los “matches”. 7) Encuentra el mejor alineamiento para cada pareja con “match” 8) Con los alineamientos, se arman los contigs de mayor a menor puntaje. Algoritmo de Phrap
  • 34. Archivos de salida de Phrap • *.contigs – Contigs en formato Fasta • *.singlets – “Singlets” en formato Fasta • *.ace – Archivo para correr el Consed • *.view – Requerido para ver en el PhrapView
  • 35. Consed Programa para ver y editar los ensamblajes. Características: a. Assembly viewer - Permite ver los contigs como alineamientos múltiples de las secuencias. b. Trace file viewer – Permite ver y comparar los cromatogramas de las diferentes secuencias alineadas. c. Navigation – Da características de las secuencias, como regiones de baja calidad o inconsistencias.