SlideShare una empresa de Scribd logo
DESARROLLO E IMPLEMENTACIÓN DE UNA 
PLATAFORMA BIOINFORMÁTICA 
PARA ANÁLISIS RNA-SEQ BASADA EN GALAXY 
Autores: Cristian Alejandro Rojas 
Luis Miguel Gutierrez 
Dirigido por: M.Sc Nelson Enrique Vera
Agenda 
❏ Introducción 
❏ Formulación del problema 
❏ Metodología 
❏ Resultados 
❏ Conclusiones 
❏ Trabajos futuros
INTRODUCCIÓN
Convenio IGUN-CECAD
Artículos Generados 
IGUN 
❏ The Transcriptome of the Caribbean Reef-building Coral Diploria strigosa 
Reveals a Highly Complex Immune Repertoire. 
❏ THE TRANSCRIPTOME OF Hydractinia symbiolongicarpus REVEALS A 
COMPLEX IMMUNE SYSTEM. 
U. Distrital 
❏ Automatic BLAST for Massive Sequencing - ABMS, Proceedings of the 
2nd Colombian Congress on Computational Biology and Bioinformatics 
(CCBCOL). 
❏ MAFA: A web based software to automate functional annotation of 
genomes and transcriptomes. Tecnura.
Ponencias 
❏ LACCEI 2013, Cancún-México, Automatic BLAST for Massive Sequencing 
- ABMS 
❏ CCBCOL 2013, Manizales-Colombia, Presentation and Evaluation of 
ABMS (Automatic Blast for Massive Sequencing) 
❏ IWBBIO 2014, Granada-España, Massive Automatic Functional 
Annotation MAFA
FORMULACIÓN DEL 
PROBLEMA
Evolución de la secuenciación 
Método de Sanger: 
Secuenciación por 
Dideoxinucleótidos 
NGS - Next Generation Sequencing: 
High-throughput sequencing 
U$2400 por 
1M bases 
U$0.05 - U$0.15 
Por 1M bases 
Hasta 52.5 Kbases 
por corrida 
Hasta 600 Gbases 
por corrida 
Datos tomados de: http://www.the-scientist.com/?articles.view/articleNo/15939/title/DNA-Sequencing-Industry-Sets-its-Sights-on-the-Future/
RNA-Seq 
El RNA-Seq es un poderoso 
método de descubrimiento, 
perfilamiento y 
cuantificación de transcritos 
de ARN. 
Aplicaciones clínicas y 
biomédicas. 
Facilitar estudio de otros 
organismos. 
Datos tomados de: http://www.rna-seqblog.com/rna-seq-library-prep-introduction/
Principales dificultades de un 
análisis RNA-Seq
Principales dificultades de un 
análisis RNA-Seq 
❏ Se requiere de computación de alto desempeño 
para su ejecución. 
❏ Herramientas no amigables para el usuario. 
❏ Formatos de entrada y salida confusos para un 
usuario final. 
❏ El usuario debe saber e integrar etapas del 
proceso.
Formulación del problema 
¿Cómo diseñar y desarrollar una herramienta 
que integre, automatice y facilite el análisis de 
de datos transcriptómicos?
Justificación 
Nuevas áreas de investigación 
Fortalece estudio de mecanismos de 
respuesta inmune en varios organismos.
Objetivo general 
Desarrollar una plataforma bioinformática basada en 
Galaxy orientada al análisis de datos RNA-Seq de acuerdo 
a las necesidades del Grupo de Inmunología Evolutiva 
(GIE) del Instituto de Genética de la Universidad Nacional 
(IGUN), haciendo uso del Centro de Cómputo de Alto 
Desempeño de la Universidad Distrital (CECAD).
Objetivos específicos 
❏ Estudiar los procesos que hacen parte de un análisis RNA-Seq. 
❏ Diseñar un pipeline que automatice los procesos 
normalmente usados en un análisis RNA-Seq. 
❏ Integrar herramientas bioinformáticas requeridas para 
realizar un análisis RNA-Seq. 
❏ Desplegar en producción la plataforma desarrollada en un 
servidor del CECAD para el público en general y así 
fortalecer la imagen de investigación de la Universidad 
Distrital.
METODOLOGÍA 
Estudio de 
requerimientos 
Diseño de 
arquitectura y 
selección de 
herramientas 
Implementación, 
configuración, 
personalización e 
integración de 
herramientas a la 
plataforma 
Acondicionamiento de 
infraestructura 
Procesos necesarios 
para RNA-Seq y 
requerimientos de la 
plataforma 
Listado de 
herramientas a 
integrar 
Evaluación Documentación 
Equipo con 
herramientas 
instaladas 
Plataforma 
funcional 
Documentación 
técnica y de usuario 
Satisfacción de 
requerimientos y cuadro 
comparativo.
Análisis de requerimientos 
❏ Reuniones con los investigadores del IGUN. 
❏ Se evidenciaron las siguientes necesidades principales: 
❏ Soporte de todos los procesos de análisis 
transcriptómico. 
❏ Interfaz de usuario amigable. 
❏ Contar con gestión de usuarios.
Selección de herramientas 
❏ Búsqueda de herramientas bioinformáticas disponibles 
para cada proceso. Revisión de bibliotecas digitales 
(Pubmed), journals y foros dedicados a bioinformática. 
❏ Selección de herramientas por su aceptación en la 
comunidad científica. 
❏ Búsqueda de plataforma base que permitiera la 
solución del problema formulado.
RESULTADOS
Flujo de trabajo
Arquitectura general
Módulo de preprocesamiento
Módulo de preprocesamiento
Módulo de mapeo
Módulo de Mapeo
Módulo de ensamblaje
Módulo de ensamblaje
Módulo de anotación
Módulo de anotación
Módulo de expresión diferencial
Módulo de expresión diferencial
Módulo de estimación de abundancia
Módulo de estimación de 
abundancia
Utilidades 
● Samtools 
○ Organización, mezcla, indexación. 
● CummeRbund 
○ Acceso, exploración, graficación. 
● EMBOSS: Transeq 
○ Traduce secuencias a péptidos
Demostración
Trabajos futuros 
● Escalabilidad horizontal 
○ Sistema distribuido 
● Herramientas 
○ Aprendizaje de máquina
Conclusiones 
● Se logró diseñar un pipeline que automatiza los procesos que hacen parte 
de un análisis RNA-Seq, a partir del estudio de dichos procesos. 
● Se desarrolló y puso en producción un software que Integra herramientas 
bioinformáticas requeridas para realizar un análisis RNA-Seq. 
● Se encontraron posibles trabajos futuros para mejorar la eficiencia de la 
plataforma y ampliar el área de trabajo en bioinformática.

Más contenido relacionado

Similar a Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

Para la correcta aprendizaje BORRADOR YANA-1.pptx
Para la correcta aprendizaje BORRADOR YANA-1.pptxPara la correcta aprendizaje BORRADOR YANA-1.pptx
Para la correcta aprendizaje BORRADOR YANA-1.pptx
StevenRojasGuerrero1
 
Investigacion unidad5
Investigacion unidad5Investigacion unidad5
Investigacion unidad5
Guillermo Medina
 
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
UNIVERSIDAD MAGISTER (Sitio Oficial)
 
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
Carlos Gabriel Asato
 
Investigacion
InvestigacionInvestigacion
Investigacion
Nicolas Cruz
 
Investigacion
InvestigacionInvestigacion
Investigacion
Nicolas Cruz
 
Comunicacion cientifica
Comunicacion cientificaComunicacion cientifica
Comunicacion cientifica
Paola Ramos Siwon
 
Tópicos Avanzados
Tópicos AvanzadosTópicos Avanzados
Tópicos Avanzados
Mayreg Baez
 
Cali moreno-doc-final-v7
Cali moreno-doc-final-v7Cali moreno-doc-final-v7
Cali moreno-doc-final-v7
Gustavo Cali
 
Sistema de informacion
Sistema de informacionSistema de informacion
Sistema de informacionYhinmy Romero
 
Investigacion unidad 5.docx
Investigacion unidad 5.docxInvestigacion unidad 5.docx
Investigacion unidad 5.docx
neyian
 
Guía análisis
Guía análisis Guía análisis
Guía análisis
Hernando Castañeda Aguirre
 
Guía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdfGuía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdf
ingandreshoyosparra
 
Guía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdfGuía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdf
ingandreshoyosparra
 
Procesos, Daniel Victor Guebel
Procesos, Daniel Victor GuebelProcesos, Daniel Victor Guebel
Procesos, Daniel Victor Guebel
Maria Dolores Garcia Fernandez
 
Prototipo De Sistema Experto Para El Mantenimiento de PCs
Prototipo De Sistema Experto Para El Mantenimiento de PCsPrototipo De Sistema Experto Para El Mantenimiento de PCs
Prototipo De Sistema Experto Para El Mantenimiento de PCs
Universidad Pedagógica y Tecnologica de Colombia
 
Digitales ii 2012
Digitales ii 2012Digitales ii 2012
Digitales ii 2012
oscarcabrales
 
Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...
Manuel Mujica
 

Similar a Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq (20)

Para la correcta aprendizaje BORRADOR YANA-1.pptx
Para la correcta aprendizaje BORRADOR YANA-1.pptxPara la correcta aprendizaje BORRADOR YANA-1.pptx
Para la correcta aprendizaje BORRADOR YANA-1.pptx
 
Investigacion unidad5
Investigacion unidad5Investigacion unidad5
Investigacion unidad5
 
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
Evaluación del Sistema de Procesamiento de Grabdes Volúmenes de Datos Científ...
 
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
Impacto del GIS Libre y los Estándares Abiertos en el Estado y la Academia - ...
 
Presentacion3
Presentacion3Presentacion3
Presentacion3
 
Investigacion
InvestigacionInvestigacion
Investigacion
 
Investigacion
InvestigacionInvestigacion
Investigacion
 
Comunicacion cientifica
Comunicacion cientificaComunicacion cientifica
Comunicacion cientifica
 
Tópicos Avanzados
Tópicos AvanzadosTópicos Avanzados
Tópicos Avanzados
 
Clase 11
Clase 11Clase 11
Clase 11
 
Cali moreno-doc-final-v7
Cali moreno-doc-final-v7Cali moreno-doc-final-v7
Cali moreno-doc-final-v7
 
Sistema de informacion
Sistema de informacionSistema de informacion
Sistema de informacion
 
Investigacion unidad 5.docx
Investigacion unidad 5.docxInvestigacion unidad 5.docx
Investigacion unidad 5.docx
 
Guía análisis
Guía análisis Guía análisis
Guía análisis
 
Guía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdfGuía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdf
 
Guía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdfGuía de aprendizaje alistar materiales.pdf
Guía de aprendizaje alistar materiales.pdf
 
Procesos, Daniel Victor Guebel
Procesos, Daniel Victor GuebelProcesos, Daniel Victor Guebel
Procesos, Daniel Victor Guebel
 
Prototipo De Sistema Experto Para El Mantenimiento de PCs
Prototipo De Sistema Experto Para El Mantenimiento de PCsPrototipo De Sistema Experto Para El Mantenimiento de PCs
Prototipo De Sistema Experto Para El Mantenimiento de PCs
 
Digitales ii 2012
Digitales ii 2012Digitales ii 2012
Digitales ii 2012
 
Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...
 

Más de Cristian Alejandro Rojas Quintero

Tipos de datos en R
Tipos de datos en RTipos de datos en R
Análisis de datos: R vs Python
Análisis de datos: R vs PythonAnálisis de datos: R vs Python
Análisis de datos: R vs Python
Cristian Alejandro Rojas Quintero
 
Lenguaje de programación Ruby
Lenguaje de programación RubyLenguaje de programación Ruby
Lenguaje de programación Ruby
Cristian Alejandro Rojas Quintero
 
Metasploit
MetasploitMetasploit
Tutorial freeradius + Mysql
Tutorial freeradius + MysqlTutorial freeradius + Mysql
Tutorial freeradius + Mysql
Cristian Alejandro Rojas Quintero
 
Nmap
NmapNmap
High Performance Computing con Software libre
High Performance Computing con Software libreHigh Performance Computing con Software libre
High Performance Computing con Software libre
Cristian Alejandro Rojas Quintero
 

Más de Cristian Alejandro Rojas Quintero (8)

Tipos de datos en R
Tipos de datos en RTipos de datos en R
Tipos de datos en R
 
Análisis de datos: R vs Python
Análisis de datos: R vs PythonAnálisis de datos: R vs Python
Análisis de datos: R vs Python
 
Lenguaje de programación Ruby
Lenguaje de programación RubyLenguaje de programación Ruby
Lenguaje de programación Ruby
 
Metasploit
MetasploitMetasploit
Metasploit
 
Tutorial freeradius + Mysql
Tutorial freeradius + MysqlTutorial freeradius + Mysql
Tutorial freeradius + Mysql
 
Nmap
NmapNmap
Nmap
 
High Performance Computing con Software libre
High Performance Computing con Software libreHigh Performance Computing con Software libre
High Performance Computing con Software libre
 
Hpc
HpcHpc
Hpc
 

Último

TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
thomasdcroz38
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
IsabellaRubio6
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
PABLOCESARGARZONBENI
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
cdraco
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
vazquezgarciajesusma
 
Desarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdfDesarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdf
samuelvideos
 
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
AlejandraCasallas7
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
ValeriaAyala48
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
SamuelRamirez83524
 
Posnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativaPosnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativa
Fernando Villares
 
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGATAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
arriagaanggie50
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
IsabelQuintero36
 
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
espinozaernesto427
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
cristianrb0324
 
Trabajo tecnología sobre Conceptos Básicos De Programación
Trabajo tecnología sobre Conceptos Básicos De ProgramaciónTrabajo tecnología sobre Conceptos Básicos De Programación
Trabajo tecnología sobre Conceptos Básicos De Programación
SofiaCollazos
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
CesarPazosQuispe
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
cofferub
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
Emilio Casbas
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
evelinglilibethpeafi
 

Último (20)

TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdfTRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
TRABAJO DESARROLLO DE HABILIDADES DE PENSAMIENTO.pdf
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
 
EduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clasesEduFlex, una educación accesible para quienes no entienden en clases
EduFlex, una educación accesible para quienes no entienden en clases
 
3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto3Redu: Responsabilidad, Resiliencia y Respeto
3Redu: Responsabilidad, Resiliencia y Respeto
 
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
(PROYECTO) Límites entre el Arte, los Medios de Comunicación y la Informática
 
Desarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdfDesarrollo de habilidades de pensamiento (2).pdf
Desarrollo de habilidades de pensamiento (2).pdf
 
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdfDesarrollo de Habilidades de Pensamiento.docx (3).pdf
Desarrollo de Habilidades de Pensamiento.docx (3).pdf
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
 
Estructuras básicas_ conceptos de programación (1).docx
Estructuras básicas_ conceptos de programación  (1).docxEstructuras básicas_ conceptos de programación  (1).docx
Estructuras básicas_ conceptos de programación (1).docx
 
Posnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativaPosnarrativas en la era de la IA generativa
Posnarrativas en la era de la IA generativa
 
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGATAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
TAREA #6 - RECURSOS INCLUSIVOS POR ANGGIE ARRIAGA
 
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..ACTIVIDAD 2P de Tecnología, 10-7, 2024..
ACTIVIDAD 2P de Tecnología, 10-7, 2024..
 
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
Las lámparas de alta intensidad de descarga o lámparas de descarga de alta in...
 
Estructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdfEstructuras Básicas_Tecnología_Grado10-7.pdf
Estructuras Básicas_Tecnología_Grado10-7.pdf
 
Trabajo tecnología sobre Conceptos Básicos De Programación
Trabajo tecnología sobre Conceptos Básicos De ProgramaciónTrabajo tecnología sobre Conceptos Básicos De Programación
Trabajo tecnología sobre Conceptos Básicos De Programación
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
 
Inteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdfInteligencia Artificial y Ciberseguridad.pdf
Inteligencia Artificial y Ciberseguridad.pdf
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
 

Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq

  • 1. DESARROLLO E IMPLEMENTACIÓN DE UNA PLATAFORMA BIOINFORMÁTICA PARA ANÁLISIS RNA-SEQ BASADA EN GALAXY Autores: Cristian Alejandro Rojas Luis Miguel Gutierrez Dirigido por: M.Sc Nelson Enrique Vera
  • 2. Agenda ❏ Introducción ❏ Formulación del problema ❏ Metodología ❏ Resultados ❏ Conclusiones ❏ Trabajos futuros
  • 5. Artículos Generados IGUN ❏ The Transcriptome of the Caribbean Reef-building Coral Diploria strigosa Reveals a Highly Complex Immune Repertoire. ❏ THE TRANSCRIPTOME OF Hydractinia symbiolongicarpus REVEALS A COMPLEX IMMUNE SYSTEM. U. Distrital ❏ Automatic BLAST for Massive Sequencing - ABMS, Proceedings of the 2nd Colombian Congress on Computational Biology and Bioinformatics (CCBCOL). ❏ MAFA: A web based software to automate functional annotation of genomes and transcriptomes. Tecnura.
  • 6. Ponencias ❏ LACCEI 2013, Cancún-México, Automatic BLAST for Massive Sequencing - ABMS ❏ CCBCOL 2013, Manizales-Colombia, Presentation and Evaluation of ABMS (Automatic Blast for Massive Sequencing) ❏ IWBBIO 2014, Granada-España, Massive Automatic Functional Annotation MAFA
  • 8. Evolución de la secuenciación Método de Sanger: Secuenciación por Dideoxinucleótidos NGS - Next Generation Sequencing: High-throughput sequencing U$2400 por 1M bases U$0.05 - U$0.15 Por 1M bases Hasta 52.5 Kbases por corrida Hasta 600 Gbases por corrida Datos tomados de: http://www.the-scientist.com/?articles.view/articleNo/15939/title/DNA-Sequencing-Industry-Sets-its-Sights-on-the-Future/
  • 9. RNA-Seq El RNA-Seq es un poderoso método de descubrimiento, perfilamiento y cuantificación de transcritos de ARN. Aplicaciones clínicas y biomédicas. Facilitar estudio de otros organismos. Datos tomados de: http://www.rna-seqblog.com/rna-seq-library-prep-introduction/
  • 10. Principales dificultades de un análisis RNA-Seq
  • 11. Principales dificultades de un análisis RNA-Seq ❏ Se requiere de computación de alto desempeño para su ejecución. ❏ Herramientas no amigables para el usuario. ❏ Formatos de entrada y salida confusos para un usuario final. ❏ El usuario debe saber e integrar etapas del proceso.
  • 12. Formulación del problema ¿Cómo diseñar y desarrollar una herramienta que integre, automatice y facilite el análisis de de datos transcriptómicos?
  • 13. Justificación Nuevas áreas de investigación Fortalece estudio de mecanismos de respuesta inmune en varios organismos.
  • 14. Objetivo general Desarrollar una plataforma bioinformática basada en Galaxy orientada al análisis de datos RNA-Seq de acuerdo a las necesidades del Grupo de Inmunología Evolutiva (GIE) del Instituto de Genética de la Universidad Nacional (IGUN), haciendo uso del Centro de Cómputo de Alto Desempeño de la Universidad Distrital (CECAD).
  • 15. Objetivos específicos ❏ Estudiar los procesos que hacen parte de un análisis RNA-Seq. ❏ Diseñar un pipeline que automatice los procesos normalmente usados en un análisis RNA-Seq. ❏ Integrar herramientas bioinformáticas requeridas para realizar un análisis RNA-Seq. ❏ Desplegar en producción la plataforma desarrollada en un servidor del CECAD para el público en general y así fortalecer la imagen de investigación de la Universidad Distrital.
  • 16. METODOLOGÍA Estudio de requerimientos Diseño de arquitectura y selección de herramientas Implementación, configuración, personalización e integración de herramientas a la plataforma Acondicionamiento de infraestructura Procesos necesarios para RNA-Seq y requerimientos de la plataforma Listado de herramientas a integrar Evaluación Documentación Equipo con herramientas instaladas Plataforma funcional Documentación técnica y de usuario Satisfacción de requerimientos y cuadro comparativo.
  • 17. Análisis de requerimientos ❏ Reuniones con los investigadores del IGUN. ❏ Se evidenciaron las siguientes necesidades principales: ❏ Soporte de todos los procesos de análisis transcriptómico. ❏ Interfaz de usuario amigable. ❏ Contar con gestión de usuarios.
  • 18. Selección de herramientas ❏ Búsqueda de herramientas bioinformáticas disponibles para cada proceso. Revisión de bibliotecas digitales (Pubmed), journals y foros dedicados a bioinformática. ❏ Selección de herramientas por su aceptación en la comunidad científica. ❏ Búsqueda de plataforma base que permitiera la solución del problema formulado.
  • 30. Módulo de expresión diferencial
  • 31. Módulo de expresión diferencial
  • 32. Módulo de estimación de abundancia
  • 33. Módulo de estimación de abundancia
  • 34. Utilidades ● Samtools ○ Organización, mezcla, indexación. ● CummeRbund ○ Acceso, exploración, graficación. ● EMBOSS: Transeq ○ Traduce secuencias a péptidos
  • 36. Trabajos futuros ● Escalabilidad horizontal ○ Sistema distribuido ● Herramientas ○ Aprendizaje de máquina
  • 37. Conclusiones ● Se logró diseñar un pipeline que automatiza los procesos que hacen parte de un análisis RNA-Seq, a partir del estudio de dichos procesos. ● Se desarrolló y puso en producción un software que Integra herramientas bioinformáticas requeridas para realizar un análisis RNA-Seq. ● Se encontraron posibles trabajos futuros para mejorar la eficiencia de la plataforma y ampliar el área de trabajo en bioinformática.