SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
132	 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138
Bioinformática: una oportunidad y un desafío
Bioinformatics presents both an opportunity
and a challenge
Emiliano Barreto Hernández1
Recibido: mayo 9 de 2008		 Aprobado: mayo 29 de 2008
En los últimos diez años las diferentes áreas de la biología han tenido que lidiar
con nuevas metodologías provenientes del área de la computación, tales como el desa-
rrollo de nuevos algoritmos y aplicaciones matemáticas, diseñadas especialmente para
la integración y el análisis del cúmulo de datos que se han generando de la aplicación
de las metodologías de alto rendimiento en la investigación biológica, desarrolladas
paralelamente con el proyecto genoma humano (The Internacional Human Genome
Sequencing Consortium, 2001) en áreas como la genómica, la transcriptómica, pro-
teómica, metabolómica y otras ómicas.
Los datos biológicos crecen exponencialmente
El crecimiento de los datos biológicos, que han pasado de 606 secuencias de
ADN almacenadas en 1982, a más de 82 millones hoy en día, fue impulsado por el
desarrollo de la técnica Reacción en Cadena de la Polimerasa (PCR) en el año de 1986
(Mullis, 1990), y ahora por la aparición de las denominadas nuevas tecnologías de alto
rendimiento en experimentación biológica.
Los vertiginosos avances en el desarrollo de la siguiente generación de las tecno-
logías de secuenciación han llevado a producción de equipos comerciales de altísimo
rendimiento y economía, capaces de producir diariamente enormes cantidades de da-
tos, como es el caso de la secuenciación masiva en paralelo de Illumina (Solexa) que con
su “Genome Analyzer” puede secuenciar en una simple corrida más de un billón de
bases (Hall, 2007). Las primeras aplicaciones de estas nuevas metodologías de secuen-
ciación incluyen análisis de genómica comparativa, genómica de microorganismos, la
detección de SNP de alto rendimiento, secuenciación y análisis de ARN pequeños,
1	 Ph D. c, Ms C. Profesor Asociado, Director Grupo de Bioinformática, Instituto de Biotecnología, Uni-
versidad Nacional de Colombia – Sede Bogotá.
Bioinformática: una oportunidad y un desafío 	 133
identificación de mutaciones de genes en rutas metabólicas asociadas a enfermedades,
análisis transcriptomas de organismos de los que se tiene muy poca información (meta-
genómica de microorganismos no cultivables, por ejemplo), determinación de genes con
bajas tasas de expresión en sus ambientes naturales, y la obtención de información sobre la
poco estudiada variación genética a nivel de especies, poblaciones y ecosistemas.
Los datos obtenidos por las nuevas técnicas de secuenciación, además de ayudar
al descubrimiento de mejores estrategias para el diagnóstico, tratamiento y prevención
de enfermedades, jugarán un papel clave en hacer realidad la medicina personalizada
ya que, relativamente pronto, se espera alcanzar la meta de secuenciar un genoma
humano por 1000 dólares, haciendo que bases de datos como el GeneBank, EMBL
y DDBJ, ahora cuenten con un nuevo conjunto de datos con más de 27 millones de
secuencias adicionales provenientes de la secuenciación de genomas usando la técnica
de Whole-Genome Shotgun (WGS) (Benson et ál., 2008).
La masiva cantidad de datos que se generarán en el futuro inmediato por la
utilización de las nuevas tecnologías de secuenciación, unida a la que diariamente se
produce por la aplicación de metodologías como los microarreglos, por medio de la
cual en un solo experimento se pueden generar millones de datos, almacenados en
bases de datos como ArrayExpress (EBI, 2008), o la obtención de datos provenientes
de la espectrometría de masas en tándem para la detección de proteomas completos,
entre muchas otras, conllevan necesariamente al reto de diseñar procesos que permi-
tan almacenar, actualizar y poner a disposición de otros investigadores estos datos de
manera permanente y confiable.
Los grupos de investigación dedicados a la bioinformática tendrán que desarro-
llar formas distribuidas de almacenamiento para sus bases datos a fin de hacer más
fácil su almacenamiento local, ya que se espera que pasen muy rápidamente del orden
de 103 millones (Gigas bites) a 106 millones (Tera bites), y aunque los costos del
almacenamiento siguen disminuyendo a nivel mundial, la disponibilidad de almacena-
miento que se requiere en un futuro implicará costos elevados, y por ello se hará ne-
cesario una mayor optimización de este recurso. Así mismo, se prevé que tendrán que
implementarse, a través de Internet, estrategias de comunicación con distribuidores
de datos como el Centro Nacional de Información de Biotecnología de los Estados
Unidos (NCBI), o el Instituto Europeo de Bioinformática (EBI), cada vez más efi-
cientes y veloces, para permitir la actualización, sincronización y consulta permanente
de las bases de datos, y que funcionen adecuadamente dentro de las limitaciones de la
cada vez más congestionada Internet, y el enorme volumen de datos que implican las
principales bases de datos biológicos.
Nuevas estrategias de análisis
La bioinformática dio un giro en su enfoque a mediados de los años noventa,
perfilándose como un área de investigación gracias al desarrollo de proyectos de se-
cuenciación como el del genoma humano (The Internacional Human Genome Se-
quencing Consortium, 2001), y de otros organismos importantes en las áreas de la
salud y la industria, lo cual propició el desarrollo de herramientas bioinformáticas que
se han utilizado para realizar estudios en la organización de los genomas, el “descubri-
miento” de genes, la relación entre las mutaciones y la alteración de la función bioló-
134	 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138
gica o la evolución de diferentes organismos, entre muchas otras, que han facilitado el
desarrollo de disciplinas como la genómica, la proteómica y la filogenia. El desarrollo
de herramientas bioinformáticas se está proyectando al diseño y la generación de
sistemas eficientes de almacenamiento y nuevos modelos para la comparación y aná-
lisis de las distintas clases de datos biológicos, rápidos y confiables, de los resultados
desde el punto de vista estadístico, como es el caso del algoritmo BLAST (Altschul
et ál., 1990), tal vez el más utilizado en la actualidad para comparar en unos cuantos
segundos una secuencia contra los millones de secuencias almacenadas en una base
de datos como GeneBank.
La utilización de tecnologías de alto rendimiento en investigación biológica, lle-
va a que las actuales estrategias de análisis requieran de su adaptación o de nuevos
desarrollos, como ocurre en el caso de las nuevas metodologías de secuenciación, ya
que las estrategias de análisis para la obtención de las secuencias de ADN que están
basadas actualmente en la química de Sanger y su asignación de bases (Base Calling),
no son adecuadas. Estas nuevas metodologías se caracterizan por un cubrimiento re-
lativamente profundo, longitudes de lectura cortas y altos porcentajes de error en las
secuencias, lo que requiere de nuevas formas de asignación de las bases, de ensamblaje
de las secuencias y alteración de los métodos estadísticos para la determinación de
puntajes de calidad de las mismas.
Los bajos costos y la rapidez de estas nuevas metodologías de secuenciación
harán que los investigadores tengan acceso a un número cada vez más grande de
genomas de microorganismos, que en la actualidad se aproxima los 1000 genomas
secuenciados, y se cuenta con el muestreo de más de 100 condiciones de ambien-
tes diferentes utilizando aproximaciones metagenómicas, haciendo necesarias nuevas
aproximaciones más precisas, consistentes y de alto rendimiento a la anotación y el
descubrimiento de la función biológica, para que esta gran cantidad de datos de di-
versidad genómica sea útil a la comunidad científica. Estos procedimientos, además,
implican un cambio en el diseño de los algoritmos de análisis para aprovechar en toda
su dimensión la computación de alto rendimiento (Guim et ál., 2007), necesaria para
el manejo y análisis de cantidades tan grades de datos como los que se producen en
un solo experimento realizado con estas tecnologías de secuenciación.
Este inmenso volumen de datos que se está generando, una vez almacenado, re-
quiere de modelos de análisis nuevos que permitan hacerlos comparables en la medida
que son obtenidos utilizando un variado conjunto de técnicas y condiciones experi-
mentales, como ocurre, por ejemplo, en el desarrollo de un sistema de clasificación y
seguimiento epidemiológico de ß-lactamasas (grupo de proteínas responsable de una
gran parte de la resistencia de las bacterias frente a antibióticos ß-lactámicos como
las penicilinas y las cefalosporinas) como sistema de información sobre ß-lactamasas
BLA-Id (BLA-Id, 2008), que implica el diseño de sistemas de anotación automático
que busquen las secuencias en bases de datos como EMBL y UNIPROT, las alma-
cenen y después las clasifiquen. Procesos que aunque parecen triviales requieren de
formas novedosas de manejar los errores de clasificación presentes en las bases de
datos y algoritmos para la integración de las diversas clasificaciones disponibles en el
proceso.
Bioinformática: una oportunidad y un desafío 	 135
En este contexto, otro aleccionador ejemplo es la masiva cantidad de datos
obtenidos de microarreglos almacenados en bases de datos, provenientes de todas
partes del mundo aplicando metodologías diversas como la de lectura en uno o
dos canales según el método de etiquetado, utilizado para visualizar las secuencias
hibridadas; el uso de secuencias cortas, medianas o largas en los oligos que con-
forman los microarreglos, o el uso de microarreglos fabricados por casas comer-
ciales como Affymetrics o fabricados por los propios investigadores (Pham et ál.,
2006). La enorme generación de datos hace que muchos grupos de investigación
en bioinformática se encuentren desarrollando nuevas metodologías estadísticas
de análisis que modelen algunos de los factores de variación mencionados, y per-
mitan tener una medida estándar y confiable estadísticamente de la expresión
de los genes, que posibiliten su comparación independientemente de la técnica
experimental utilizada.
Parte de los esfuerzos de investigación en bioinformática estarán dedicados a
la búsqueda e integración de datos de diferente índole que estarán disponibles en
los bancos de datos, con el objeto de tener una mayor comprensión de las funciones
biológicas. No sólo estamos frente a la necesidad de modificar los algoritmos actuales
para que hagan uso de los sistemas de alto rendimiento de cómputo, sino frente al
desarrollo de nuevos algoritmos que utilicen más intensivamente herramientas como
los modelos ocultos de Markov, algoritmos de aprendizaje como las redes booleanas,
Support Vector Machines y redes neuronales, entre otros. Esto llevará al desarrollo
de aplicaciones para la anotación de alto rendimiento requeridas para responder a las
necesidades de análisis de los datos que generan técnicas como la de secuenciación
de alto rendimiento; al desarrollo de herramientas para la búsqueda de nuevos genes
a partir de la comparación de genomas completos realizadas en supercomputadores
como el Mare Nostrum con más de 6000 procesadores en paralelo, del Centro Na-
cional de Supercomputación de España (CNS, 2008); comparaciones que requieren
de la integración de diferentes tipos de datos a los datos de secuencias, y al diseño e
implementación de herramientas para la modelación y simulación de sistemas bioló-
gicos (Reyes et ál., 2007).
En el futuro próximo áreas nuevas como “System Biology” o “Network Biolo-
gy” (términos en inglés que aun no tienen un consenso de cómo deben ser traducirlos
al español), que se basan en la teoría de sistemas esbozada a mediados del siglo XX,
estarán cada vez más presentes en las publicaciones científicas, mostrando cómo a tra-
vés del descubrimiento de los principios de diseño, la identificación de componentes
dentro de los sistemas biológicos, y la comprensión cuantitativa de su funcionamiento
por medio de experimentos y simulación, se podrán elucidar la funciones biológicas y
predecir cómo cambian frente a perturbaciones internas como las mutaciones, y ex-
ternas como los fármacos, lo que podría llevar a un tratamiento más preciso y efectivo
de las enfermedades. Así, aunque aún estamos lejos de entender por completo los sis-
temas biológicos debido a su complejidad por tratarse de sistemas naturales, y de que
no es posible conocer todas las interacciones que ocurren a este nivel para modelarlas
de forma integral, un esfuerzo mayor en el desarrollo de herramientas bioinformáti-
cas para la integración de experimentación y modelación, nos acercará cada vez más a
esto, permitiéndonos nuevas e interesantes aplicaciones.
136	 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138
La bioinformática y las perspectivas para Colombia
Considerando que en la época actual la bioinformática no sólo se restringe al
análisis de datos moleculares, la integración de datos de biodiversidad constituye uno
de los aspectos de la investigación y el desarrollo en los cuales los grupos de bio-
informática pueden encontrar un conjunto de problemas interesantes y pertinentes
para resolver, ya que aunque Colombia es uno de los países con mayor biodiversidad
del mundo, enfrenta el reto de iniciar varios frentes de acción de forma sistemática
y coordinada, para consolidar el conocimiento completo de dicha biodiversidad. La
bioinformática ofrece las herramientas y los conceptos para sistematizar ese conoci-
miento.
Es importante destacar que en la actualidad cualquier proyecto a nivel mun-
dial que busque realizar investigación en genómica, transcriptómica, proteómica,
metabolómica, y cualquiera de las otras ómicas, requiere de un fuerte apoyo
de la bioinformática en el desarrollo e implementación de nuevas aplicaciones
particulares que permitan rentabilizar la información generada, sobre todo si se
considera que, con base en las respuestas obtenidas utilizando los desarrollos
bioinformáticos, se avanzará mucho más rápido y con mayor confianza en la ex-
perimentación biológica de cualquier tipo. Esto significa que no solamente se
debe propiciar y financiar la investigación en el área de la bioinformática en Co-
lombia que ha mostrado ser competitiva a nivel mundial independientemente de
la experimentación biológica que se realiza en el país, sino que para hacer más
competitiva la generación de conocimiento biológico debe ser integrada con igual
jerarquía a las líneas de investigación, para darles la competitividad que requieren
para su desarrollo.
Lo anterior se hace más apremiante si consideramos que en este momento nues-
tras líneas de investigación se ven enfrentadas, necesariamente, a la utilización técni-
cas de alto rendimiento para la generación de datos biológicos, haciéndose necesario
avanzar en la implementación de una plataforma bioinformática común para el ma-
nejo sistemático de estos datos, en especial los que se obtienen de forma masiva por
la aplicación de tecnologías en áreas como la genómica, transcriptómica, proteómica
y metabolómica, coadyuvando a la disminución de los costos de desarrollo e imple-
mentación de herramientas.
Esta plataforma bioinformática implica implementar un sistema computacional
de alto rendimiento, unido a una red de expertos en bioinformática trabajando coor-
dinadamente en la detección de los problemas biológicos por resolver. Para tal efecto
se requiere de la implementación de un centro especializado en bioinformática de alto
rendimiento de cálculo y comunicación, de la formación de personal especializado
en esta área, y de la adecuación o el desarrollo de las herramientas bioinformáticas
específicas. Esta plataforma computacional deberá estar basada en la implementación
de los desarrollos, productos y servicios seleccionados a partir de las necesidades de
los diferentes grupos de investigación, de tal forma que se mantenga un intercambio
permanente de necesidades y servicios con los grupos que se encargan de la genera-
ción de los datos biológicos.
Este centro podría tener un carácter virtual como ocurre con Instituto Suizo
de Bioinformática, que como centro nacional coordina el desarrollo de los proyectos
Bioinformática: una oportunidad y un desafío 	 137
de bioinformática en Suiza reuniendo a los expertos en el tema para provechar su
experiencia en investigación y desarrollo en el área, y maximizar la infraestructura
requerida, pero al mismo tiempo manteniéndolos vinculados con sus instituciones
de origen (universidades e institutos de investigación) con el objeto de que siempre
exista participación de éstos dentro de las líneas de investigación propias de cada
institución.
En nuestro caso se podría comenzar por la coordinación del recurso humano
y técnico que, aunque limitado, actualmente existe en Colombia. Algunos grupos
y centros de la Universidad del Valle, la Universidad Nacional de Colombia con
grupos como el de Bioinformática del Instituto de Biotecnología encargado de la
operación del Nodo Colombiano de la Red Europea de Biología Molecular (EMB-
net), y Laboratorio de Investigación en Sistemas Inteligentes (LISI) de la Facultad
de Ingeniería, Cenicafé, Universidad de los Andes, la FIDIC y la Universidad Jave-
riana, entre otros, podrían combinar sus capacidades individuales para el beneficio
de la comunidad académica que requiere de servicios, asesoría y capacitación en
bioinformática.
El futuro de la bioinformática en Colombia se erigirá sobre el esfuerzo que
realicen los grupos de investigación de nuestro país, de manera conjunta, para trans-
formar la información que se genera en el área biológica en conocimiento y desarrollo
tecnológico.
Agradecimientos
A los miembros del Grupo de Bioinformática del Instituto de Biotecnología de
la Universidad Nacional de Colombia, Sede Bogotá, y en especial a la profesora María
Teresa Reguero R., por sus aportes y comentarios a la presente nota.
Referencias bibliográficas
Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. 1990. Basic local alignment search tool. J.
Mol. Biol. 215: 403-410.
Benson, D. A.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L. 2008. GenBank. Nucleic Acids
Res. 36 (Database issue): D25-30.
BLA.id – Sistema de información sobre ß-lactamasas. 2008. Disponible en: http://bioinf.ibun.unal.edu.co/
BLA.id [Fecha de consulta: 10/05/2008, fecha actualización: 10/05/2008].
CNS - Centro Nacional de Supercomputación de España. 2008. Disponible en: www.bsc.es. [Fecha de con-
sulta: 10/05/2008, fecha actualización: 10/05/2008].
EBI - European Bioinformatics Institute. 2008. Disponible en: www.ebi.ac.uk [Fecha de consulta:
10/05/2008, fecha actualización: 10/05/2008].
Guim, F.; Rodero, I.; Corbalan, J.; Labarta, J.; Oleksiak, A.; Nabrzyski, J. 2007. Uniform Job Monitoring
in the HPC-Europa Project: Data Model, API and Services. International Journal of Web and Grid
Services 3 (3).
Hall, N. 2007. Advanced sequencing technologies and their wider impact in microbiology. J Exp Biol. 210
(9): 1518-1525.
138	 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138
Mullis, K. B. 1990. Target Amplification for DNA analysis by the polymerase chain reaction. Ann. Biol.
Clin. 48 (8): 579-82.
Pham, T. D.; Wells, C.; Crane, D. 2006. Analysis of Microarray Gene Expression Data. Current Bioinfor-
matics 1: 37-53.
Reyes, S.; Muñoz-Caro, C.; Niño, A.; Badia, R. M.; Cela, J. M. 2007. Performance of computation-intensive,
parameter sweep applications on Internet-based Grids of computers. The mapping of molecular poten-
tial energy hypersurfaces. Concurrency and Computation: Practice and Experience 19 (4).
The International Human Genome Sequencing Consortium. 2001. Initial sequencing and analysis of the
human genome. Nature 409: 860-921.

Más contenido relacionado

La actualidad más candente

Introduccion a la bioinformatica
Introduccion a la bioinformaticaIntroduccion a la bioinformatica
Introduccion a la bioinformaticacursoNGS
 
Sistemas. presentacion bioinformática
Sistemas. presentacion bioinformáticaSistemas. presentacion bioinformática
Sistemas. presentacion bioinformáticaMariaAlejandraC23
 
Bioinformatica
BioinformaticaBioinformatica
BioinformaticaCarolNav
 
Ensayo "Bioinformatica"
Ensayo "Bioinformatica"Ensayo "Bioinformatica"
Ensayo "Bioinformatica"NancyVegu
 
Bioinformatics en español
Bioinformatics en españolBioinformatics en español
Bioinformatics en españolsiuniversity
 
Introduccion a la Bioinformatica
Introduccion a la BioinformaticaIntroduccion a la Bioinformatica
Introduccion a la Bioinformaticaguestaaee08
 
Bioinformatics Biostatistics with dynamic programming and sequence alignment
Bioinformatics Biostatistics with dynamic programming and sequence alignmentBioinformatics Biostatistics with dynamic programming and sequence alignment
Bioinformatics Biostatistics with dynamic programming and sequence alignmentVictoria López
 
Enseñanza de la Bioinformatica y la Biología Computacional
Enseñanza de la Bioinformatica y la Biología ComputacionalEnseñanza de la Bioinformatica y la Biología Computacional
Enseñanza de la Bioinformatica y la Biología ComputacionalRoberto Pineda
 
Usos de la informática
Usos  de la informáticaUsos  de la informática
Usos de la informáticabryan08
 
La nanotecnologia
La nanotecnologiaLa nanotecnologia
La nanotecnologiaKarla Galan
 
Sistemática biológica avances y direcciones en la teoría y los métodos de la...
Sistemática biológica  avances y direcciones en la teoría y los métodos de la...Sistemática biológica  avances y direcciones en la teoría y los métodos de la...
Sistemática biológica avances y direcciones en la teoría y los métodos de la...Umbrella Corporation
 
Biomarcadores candidato para el diagnóstico del cáncer colorrectal
Biomarcadores candidato para el diagnóstico del cáncer colorrectalBiomarcadores candidato para el diagnóstico del cáncer colorrectal
Biomarcadores candidato para el diagnóstico del cáncer colorrectalRamiro Díaz
 

La actualidad más candente (18)

Introduccion a la bioinformatica
Introduccion a la bioinformaticaIntroduccion a la bioinformatica
Introduccion a la bioinformatica
 
Sistemas. presentacion bioinformática
Sistemas. presentacion bioinformáticaSistemas. presentacion bioinformática
Sistemas. presentacion bioinformática
 
Bioinformatica
BioinformaticaBioinformatica
Bioinformatica
 
Ensayo "Bioinformatica"
Ensayo "Bioinformatica"Ensayo "Bioinformatica"
Ensayo "Bioinformatica"
 
Bio-informatica
Bio-informaticaBio-informatica
Bio-informatica
 
Bioinformatics en español
Bioinformatics en españolBioinformatics en español
Bioinformatics en español
 
Introduccion a la Bioinformatica
Introduccion a la BioinformaticaIntroduccion a la Bioinformatica
Introduccion a la Bioinformatica
 
Bioinformatics Biostatistics with dynamic programming and sequence alignment
Bioinformatics Biostatistics with dynamic programming and sequence alignmentBioinformatics Biostatistics with dynamic programming and sequence alignment
Bioinformatics Biostatistics with dynamic programming and sequence alignment
 
Biologia computacional
Biologia computacionalBiologia computacional
Biologia computacional
 
Enseñanza de la Bioinformatica y la Biología Computacional
Enseñanza de la Bioinformatica y la Biología ComputacionalEnseñanza de la Bioinformatica y la Biología Computacional
Enseñanza de la Bioinformatica y la Biología Computacional
 
Usos de la informática
Usos  de la informáticaUsos  de la informática
Usos de la informática
 
La nanotecnologia
La nanotecnologiaLa nanotecnologia
La nanotecnologia
 
Sistemática biológica avances y direcciones en la teoría y los métodos de la...
Sistemática biológica  avances y direcciones en la teoría y los métodos de la...Sistemática biológica  avances y direcciones en la teoría y los métodos de la...
Sistemática biológica avances y direcciones en la teoría y los métodos de la...
 
Notas Related. Octubre 2015.
Notas Related. Octubre 2015.Notas Related. Octubre 2015.
Notas Related. Octubre 2015.
 
Biomarcadores candidato para el diagnóstico del cáncer colorrectal
Biomarcadores candidato para el diagnóstico del cáncer colorrectalBiomarcadores candidato para el diagnóstico del cáncer colorrectal
Biomarcadores candidato para el diagnóstico del cáncer colorrectal
 
Juan
JuanJuan
Juan
 
Impresión 3
Impresión 3Impresión 3
Impresión 3
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 

Destacado

Riesgos en las redes sociales
Riesgos en las redes socialesRiesgos en las redes sociales
Riesgos en las redes socialesItzel Reyes
 
Calvo Daniel Yolandam5
Calvo Daniel Yolandam5Calvo Daniel Yolandam5
Calvo Daniel Yolandam5ycalvo2
 
Reglamento del-ejercicio-de-la-profesion-docente
Reglamento del-ejercicio-de-la-profesion-docenteReglamento del-ejercicio-de-la-profesion-docente
Reglamento del-ejercicio-de-la-profesion-docenteVicente Salias
 
medicina veterinaria y zootecnia
medicina veterinaria y zootecniamedicina veterinaria y zootecnia
medicina veterinaria y zootecniaOSMEL FARAK
 
Jugando el mismo juego
Jugando el mismo juegoJugando el mismo juego
Jugando el mismo juegoflorioclara
 
Primary Angle Closure Glaucoma.Dr Ferdous
Primary Angle Closure Glaucoma.Dr Ferdous   Primary Angle Closure Glaucoma.Dr Ferdous
Primary Angle Closure Glaucoma.Dr Ferdous Ferdous101531
 
Sleeping Sickness Presentation
Sleeping Sickness PresentationSleeping Sickness Presentation
Sleeping Sickness PresentationJoshua Gefen
 
Manifestaciones clínicas, diagnostico, prevención b bacilliformis
Manifestaciones clínicas, diagnostico, prevención b bacilliformisManifestaciones clínicas, diagnostico, prevención b bacilliformis
Manifestaciones clínicas, diagnostico, prevención b bacilliformisBilly Reyna
 
Socio politica2
Socio politica2Socio politica2
Socio politica2sharkcom
 
Futuro digital latinoamerica 2013 de comScore
Futuro digital latinoamerica 2013 de comScoreFuturo digital latinoamerica 2013 de comScore
Futuro digital latinoamerica 2013 de comScoreClaudia Alderete
 

Destacado (17)

Riesgos en las redes sociales
Riesgos en las redes socialesRiesgos en las redes sociales
Riesgos en las redes sociales
 
Calvo Daniel Yolandam5
Calvo Daniel Yolandam5Calvo Daniel Yolandam5
Calvo Daniel Yolandam5
 
Ronaldo (o) Blatter
Ronaldo (o) BlatterRonaldo (o) Blatter
Ronaldo (o) Blatter
 
Reglamento del-ejercicio-de-la-profesion-docente
Reglamento del-ejercicio-de-la-profesion-docenteReglamento del-ejercicio-de-la-profesion-docente
Reglamento del-ejercicio-de-la-profesion-docente
 
medicina veterinaria y zootecnia
medicina veterinaria y zootecniamedicina veterinaria y zootecnia
medicina veterinaria y zootecnia
 
Jugando el mismo juego
Jugando el mismo juegoJugando el mismo juego
Jugando el mismo juego
 
Julio
JulioJulio
Julio
 
Primary Angle Closure Glaucoma.Dr Ferdous
Primary Angle Closure Glaucoma.Dr Ferdous   Primary Angle Closure Glaucoma.Dr Ferdous
Primary Angle Closure Glaucoma.Dr Ferdous
 
Últimos días de un Rey
Últimos días de un ReyÚltimos días de un Rey
Últimos días de un Rey
 
Las sorpresas del Domingo
Las sorpresas del DomingoLas sorpresas del Domingo
Las sorpresas del Domingo
 
Perez jimenez
Perez jimenezPerez jimenez
Perez jimenez
 
Manufactura
ManufacturaManufactura
Manufactura
 
Sleeping Sickness Presentation
Sleeping Sickness PresentationSleeping Sickness Presentation
Sleeping Sickness Presentation
 
Manifestaciones clínicas, diagnostico, prevención b bacilliformis
Manifestaciones clínicas, diagnostico, prevención b bacilliformisManifestaciones clínicas, diagnostico, prevención b bacilliformis
Manifestaciones clínicas, diagnostico, prevención b bacilliformis
 
Relatos del 27 n en laminas
Relatos del 27 n en laminasRelatos del 27 n en laminas
Relatos del 27 n en laminas
 
Socio politica2
Socio politica2Socio politica2
Socio politica2
 
Futuro digital latinoamerica 2013 de comScore
Futuro digital latinoamerica 2013 de comScoreFuturo digital latinoamerica 2013 de comScore
Futuro digital latinoamerica 2013 de comScore
 

Similar a Dialnet bioinformatica unaoportunidady-undesafio-2731617

Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)
Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)
Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)elioaaronespinozafar
 
Informe practica n1 emily cusilayme romero
Informe practica n1 emily cusilayme romeroInforme practica n1 emily cusilayme romero
Informe practica n1 emily cusilayme romeroEmilyCusilayme
 
Usos de la informática
Usos de la informáticaUsos de la informática
Usos de la informáticaDarlingAF
 
PROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdfPROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdfSalmaAnco1
 
Informe MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdfInforme MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdfEduardCapia
 
Aplicaciones de la computación biológica
Aplicaciones de la computación biológicaAplicaciones de la computación biológica
Aplicaciones de la computación biológicacriscrisar
 
Practica 1 analisis de secuencias del gen16 s
Practica 1   analisis de secuencias del gen16 s Practica 1   analisis de secuencias del gen16 s
Practica 1 analisis de secuencias del gen16 s KarenOriflame
 
Exposicion de seminario de fitomejoramiento kevin cano.pptx
Exposicion de seminario de fitomejoramiento kevin cano.pptxExposicion de seminario de fitomejoramiento kevin cano.pptx
Exposicion de seminario de fitomejoramiento kevin cano.pptxInesGutierrez13
 
Técnicas biomoleculares II.pdf biología molecular
Técnicas biomoleculares II.pdf biología molecularTécnicas biomoleculares II.pdf biología molecular
Técnicas biomoleculares II.pdf biología molecularMichelleRojas57
 
Reporte práctica #3
Reporte práctica #3Reporte práctica #3
Reporte práctica #3Hugh1993
 
bioinformtica-151201072811-lva1-app6892 (1).pptx
bioinformtica-151201072811-lva1-app6892 (1).pptxbioinformtica-151201072811-lva1-app6892 (1).pptx
bioinformtica-151201072811-lva1-app6892 (1).pptxIrisLuceroNepomuceno
 
Las multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaLas multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaAlberto Labarga
 

Similar a Dialnet bioinformatica unaoportunidady-undesafio-2731617 (20)

Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)
Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)
Dialnet tecnologias bioinformaticasparaelanalisisdesecuenci-4321929 (1)
 
Bioinformatica
BioinformaticaBioinformatica
Bioinformatica
 
Informe practica n1 emily cusilayme romero
Informe practica n1 emily cusilayme romeroInforme practica n1 emily cusilayme romero
Informe practica n1 emily cusilayme romero
 
Ensayo1 1
Ensayo1 1Ensayo1 1
Ensayo1 1
 
Granulocitos inmaduros
Granulocitos inmadurosGranulocitos inmaduros
Granulocitos inmaduros
 
Usos de la informática
Usos de la informáticaUsos de la informática
Usos de la informática
 
PROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdfPROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdf
 
Informe MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdfInforme MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdf
 
Pagina 159
Pagina 159Pagina 159
Pagina 159
 
Aplicaciones de la computación biológica
Aplicaciones de la computación biológicaAplicaciones de la computación biológica
Aplicaciones de la computación biológica
 
Trabajo
TrabajoTrabajo
Trabajo
 
Practica 1 analisis de secuencias del gen16 s
Practica 1   analisis de secuencias del gen16 s Practica 1   analisis de secuencias del gen16 s
Practica 1 analisis de secuencias del gen16 s
 
Exposicion de seminario de fitomejoramiento kevin cano.pptx
Exposicion de seminario de fitomejoramiento kevin cano.pptxExposicion de seminario de fitomejoramiento kevin cano.pptx
Exposicion de seminario de fitomejoramiento kevin cano.pptx
 
Mervin lubin
Mervin lubinMervin lubin
Mervin lubin
 
Técnicas biomoleculares II.pdf biología molecular
Técnicas biomoleculares II.pdf biología molecularTécnicas biomoleculares II.pdf biología molecular
Técnicas biomoleculares II.pdf biología molecular
 
Reporte práctica #3
Reporte práctica #3Reporte práctica #3
Reporte práctica #3
 
Mervin lubin
Mervin lubinMervin lubin
Mervin lubin
 
bioinformtica-151201072811-lva1-app6892 (1).pptx
bioinformtica-151201072811-lva1-app6892 (1).pptxbioinformtica-151201072811-lva1-app6892 (1).pptx
bioinformtica-151201072811-lva1-app6892 (1).pptx
 
Gen 16 s
Gen 16 sGen 16 s
Gen 16 s
 
Las multiples caras de la bioinformatica
Las multiples caras de la bioinformaticaLas multiples caras de la bioinformatica
Las multiples caras de la bioinformatica
 

Último

FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPELaura Chacón
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.DaluiMonasterio
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfromanmillans
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
codigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinacodigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinavergarakarina022
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativafiorelachuctaya2
 
CULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirCULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirPaddySydney1
 
Factores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFactores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFlor Idalia Espinoza Ortega
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 

Último (20)

FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPE
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdf
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
codigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinacodigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karina
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
plan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativaplan-de-trabajo-colegiado en una institucion educativa
plan-de-trabajo-colegiado en una institucion educativa
 
Unidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDIUnidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDI
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
CULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirCULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartir
 
Factores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamicaFactores ecosistemas: interacciones, energia y dinamica
Factores ecosistemas: interacciones, energia y dinamica
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 

Dialnet bioinformatica unaoportunidady-undesafio-2731617

  • 1. 132 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138 Bioinformática: una oportunidad y un desafío Bioinformatics presents both an opportunity and a challenge Emiliano Barreto Hernández1 Recibido: mayo 9 de 2008 Aprobado: mayo 29 de 2008 En los últimos diez años las diferentes áreas de la biología han tenido que lidiar con nuevas metodologías provenientes del área de la computación, tales como el desa- rrollo de nuevos algoritmos y aplicaciones matemáticas, diseñadas especialmente para la integración y el análisis del cúmulo de datos que se han generando de la aplicación de las metodologías de alto rendimiento en la investigación biológica, desarrolladas paralelamente con el proyecto genoma humano (The Internacional Human Genome Sequencing Consortium, 2001) en áreas como la genómica, la transcriptómica, pro- teómica, metabolómica y otras ómicas. Los datos biológicos crecen exponencialmente El crecimiento de los datos biológicos, que han pasado de 606 secuencias de ADN almacenadas en 1982, a más de 82 millones hoy en día, fue impulsado por el desarrollo de la técnica Reacción en Cadena de la Polimerasa (PCR) en el año de 1986 (Mullis, 1990), y ahora por la aparición de las denominadas nuevas tecnologías de alto rendimiento en experimentación biológica. Los vertiginosos avances en el desarrollo de la siguiente generación de las tecno- logías de secuenciación han llevado a producción de equipos comerciales de altísimo rendimiento y economía, capaces de producir diariamente enormes cantidades de da- tos, como es el caso de la secuenciación masiva en paralelo de Illumina (Solexa) que con su “Genome Analyzer” puede secuenciar en una simple corrida más de un billón de bases (Hall, 2007). Las primeras aplicaciones de estas nuevas metodologías de secuen- ciación incluyen análisis de genómica comparativa, genómica de microorganismos, la detección de SNP de alto rendimiento, secuenciación y análisis de ARN pequeños, 1 Ph D. c, Ms C. Profesor Asociado, Director Grupo de Bioinformática, Instituto de Biotecnología, Uni- versidad Nacional de Colombia – Sede Bogotá.
  • 2. Bioinformática: una oportunidad y un desafío 133 identificación de mutaciones de genes en rutas metabólicas asociadas a enfermedades, análisis transcriptomas de organismos de los que se tiene muy poca información (meta- genómica de microorganismos no cultivables, por ejemplo), determinación de genes con bajas tasas de expresión en sus ambientes naturales, y la obtención de información sobre la poco estudiada variación genética a nivel de especies, poblaciones y ecosistemas. Los datos obtenidos por las nuevas técnicas de secuenciación, además de ayudar al descubrimiento de mejores estrategias para el diagnóstico, tratamiento y prevención de enfermedades, jugarán un papel clave en hacer realidad la medicina personalizada ya que, relativamente pronto, se espera alcanzar la meta de secuenciar un genoma humano por 1000 dólares, haciendo que bases de datos como el GeneBank, EMBL y DDBJ, ahora cuenten con un nuevo conjunto de datos con más de 27 millones de secuencias adicionales provenientes de la secuenciación de genomas usando la técnica de Whole-Genome Shotgun (WGS) (Benson et ál., 2008). La masiva cantidad de datos que se generarán en el futuro inmediato por la utilización de las nuevas tecnologías de secuenciación, unida a la que diariamente se produce por la aplicación de metodologías como los microarreglos, por medio de la cual en un solo experimento se pueden generar millones de datos, almacenados en bases de datos como ArrayExpress (EBI, 2008), o la obtención de datos provenientes de la espectrometría de masas en tándem para la detección de proteomas completos, entre muchas otras, conllevan necesariamente al reto de diseñar procesos que permi- tan almacenar, actualizar y poner a disposición de otros investigadores estos datos de manera permanente y confiable. Los grupos de investigación dedicados a la bioinformática tendrán que desarro- llar formas distribuidas de almacenamiento para sus bases datos a fin de hacer más fácil su almacenamiento local, ya que se espera que pasen muy rápidamente del orden de 103 millones (Gigas bites) a 106 millones (Tera bites), y aunque los costos del almacenamiento siguen disminuyendo a nivel mundial, la disponibilidad de almacena- miento que se requiere en un futuro implicará costos elevados, y por ello se hará ne- cesario una mayor optimización de este recurso. Así mismo, se prevé que tendrán que implementarse, a través de Internet, estrategias de comunicación con distribuidores de datos como el Centro Nacional de Información de Biotecnología de los Estados Unidos (NCBI), o el Instituto Europeo de Bioinformática (EBI), cada vez más efi- cientes y veloces, para permitir la actualización, sincronización y consulta permanente de las bases de datos, y que funcionen adecuadamente dentro de las limitaciones de la cada vez más congestionada Internet, y el enorme volumen de datos que implican las principales bases de datos biológicos. Nuevas estrategias de análisis La bioinformática dio un giro en su enfoque a mediados de los años noventa, perfilándose como un área de investigación gracias al desarrollo de proyectos de se- cuenciación como el del genoma humano (The Internacional Human Genome Se- quencing Consortium, 2001), y de otros organismos importantes en las áreas de la salud y la industria, lo cual propició el desarrollo de herramientas bioinformáticas que se han utilizado para realizar estudios en la organización de los genomas, el “descubri- miento” de genes, la relación entre las mutaciones y la alteración de la función bioló-
  • 3. 134 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138 gica o la evolución de diferentes organismos, entre muchas otras, que han facilitado el desarrollo de disciplinas como la genómica, la proteómica y la filogenia. El desarrollo de herramientas bioinformáticas se está proyectando al diseño y la generación de sistemas eficientes de almacenamiento y nuevos modelos para la comparación y aná- lisis de las distintas clases de datos biológicos, rápidos y confiables, de los resultados desde el punto de vista estadístico, como es el caso del algoritmo BLAST (Altschul et ál., 1990), tal vez el más utilizado en la actualidad para comparar en unos cuantos segundos una secuencia contra los millones de secuencias almacenadas en una base de datos como GeneBank. La utilización de tecnologías de alto rendimiento en investigación biológica, lle- va a que las actuales estrategias de análisis requieran de su adaptación o de nuevos desarrollos, como ocurre en el caso de las nuevas metodologías de secuenciación, ya que las estrategias de análisis para la obtención de las secuencias de ADN que están basadas actualmente en la química de Sanger y su asignación de bases (Base Calling), no son adecuadas. Estas nuevas metodologías se caracterizan por un cubrimiento re- lativamente profundo, longitudes de lectura cortas y altos porcentajes de error en las secuencias, lo que requiere de nuevas formas de asignación de las bases, de ensamblaje de las secuencias y alteración de los métodos estadísticos para la determinación de puntajes de calidad de las mismas. Los bajos costos y la rapidez de estas nuevas metodologías de secuenciación harán que los investigadores tengan acceso a un número cada vez más grande de genomas de microorganismos, que en la actualidad se aproxima los 1000 genomas secuenciados, y se cuenta con el muestreo de más de 100 condiciones de ambien- tes diferentes utilizando aproximaciones metagenómicas, haciendo necesarias nuevas aproximaciones más precisas, consistentes y de alto rendimiento a la anotación y el descubrimiento de la función biológica, para que esta gran cantidad de datos de di- versidad genómica sea útil a la comunidad científica. Estos procedimientos, además, implican un cambio en el diseño de los algoritmos de análisis para aprovechar en toda su dimensión la computación de alto rendimiento (Guim et ál., 2007), necesaria para el manejo y análisis de cantidades tan grades de datos como los que se producen en un solo experimento realizado con estas tecnologías de secuenciación. Este inmenso volumen de datos que se está generando, una vez almacenado, re- quiere de modelos de análisis nuevos que permitan hacerlos comparables en la medida que son obtenidos utilizando un variado conjunto de técnicas y condiciones experi- mentales, como ocurre, por ejemplo, en el desarrollo de un sistema de clasificación y seguimiento epidemiológico de ß-lactamasas (grupo de proteínas responsable de una gran parte de la resistencia de las bacterias frente a antibióticos ß-lactámicos como las penicilinas y las cefalosporinas) como sistema de información sobre ß-lactamasas BLA-Id (BLA-Id, 2008), que implica el diseño de sistemas de anotación automático que busquen las secuencias en bases de datos como EMBL y UNIPROT, las alma- cenen y después las clasifiquen. Procesos que aunque parecen triviales requieren de formas novedosas de manejar los errores de clasificación presentes en las bases de datos y algoritmos para la integración de las diversas clasificaciones disponibles en el proceso.
  • 4. Bioinformática: una oportunidad y un desafío 135 En este contexto, otro aleccionador ejemplo es la masiva cantidad de datos obtenidos de microarreglos almacenados en bases de datos, provenientes de todas partes del mundo aplicando metodologías diversas como la de lectura en uno o dos canales según el método de etiquetado, utilizado para visualizar las secuencias hibridadas; el uso de secuencias cortas, medianas o largas en los oligos que con- forman los microarreglos, o el uso de microarreglos fabricados por casas comer- ciales como Affymetrics o fabricados por los propios investigadores (Pham et ál., 2006). La enorme generación de datos hace que muchos grupos de investigación en bioinformática se encuentren desarrollando nuevas metodologías estadísticas de análisis que modelen algunos de los factores de variación mencionados, y per- mitan tener una medida estándar y confiable estadísticamente de la expresión de los genes, que posibiliten su comparación independientemente de la técnica experimental utilizada. Parte de los esfuerzos de investigación en bioinformática estarán dedicados a la búsqueda e integración de datos de diferente índole que estarán disponibles en los bancos de datos, con el objeto de tener una mayor comprensión de las funciones biológicas. No sólo estamos frente a la necesidad de modificar los algoritmos actuales para que hagan uso de los sistemas de alto rendimiento de cómputo, sino frente al desarrollo de nuevos algoritmos que utilicen más intensivamente herramientas como los modelos ocultos de Markov, algoritmos de aprendizaje como las redes booleanas, Support Vector Machines y redes neuronales, entre otros. Esto llevará al desarrollo de aplicaciones para la anotación de alto rendimiento requeridas para responder a las necesidades de análisis de los datos que generan técnicas como la de secuenciación de alto rendimiento; al desarrollo de herramientas para la búsqueda de nuevos genes a partir de la comparación de genomas completos realizadas en supercomputadores como el Mare Nostrum con más de 6000 procesadores en paralelo, del Centro Na- cional de Supercomputación de España (CNS, 2008); comparaciones que requieren de la integración de diferentes tipos de datos a los datos de secuencias, y al diseño e implementación de herramientas para la modelación y simulación de sistemas bioló- gicos (Reyes et ál., 2007). En el futuro próximo áreas nuevas como “System Biology” o “Network Biolo- gy” (términos en inglés que aun no tienen un consenso de cómo deben ser traducirlos al español), que se basan en la teoría de sistemas esbozada a mediados del siglo XX, estarán cada vez más presentes en las publicaciones científicas, mostrando cómo a tra- vés del descubrimiento de los principios de diseño, la identificación de componentes dentro de los sistemas biológicos, y la comprensión cuantitativa de su funcionamiento por medio de experimentos y simulación, se podrán elucidar la funciones biológicas y predecir cómo cambian frente a perturbaciones internas como las mutaciones, y ex- ternas como los fármacos, lo que podría llevar a un tratamiento más preciso y efectivo de las enfermedades. Así, aunque aún estamos lejos de entender por completo los sis- temas biológicos debido a su complejidad por tratarse de sistemas naturales, y de que no es posible conocer todas las interacciones que ocurren a este nivel para modelarlas de forma integral, un esfuerzo mayor en el desarrollo de herramientas bioinformáti- cas para la integración de experimentación y modelación, nos acercará cada vez más a esto, permitiéndonos nuevas e interesantes aplicaciones.
  • 5. 136 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138 La bioinformática y las perspectivas para Colombia Considerando que en la época actual la bioinformática no sólo se restringe al análisis de datos moleculares, la integración de datos de biodiversidad constituye uno de los aspectos de la investigación y el desarrollo en los cuales los grupos de bio- informática pueden encontrar un conjunto de problemas interesantes y pertinentes para resolver, ya que aunque Colombia es uno de los países con mayor biodiversidad del mundo, enfrenta el reto de iniciar varios frentes de acción de forma sistemática y coordinada, para consolidar el conocimiento completo de dicha biodiversidad. La bioinformática ofrece las herramientas y los conceptos para sistematizar ese conoci- miento. Es importante destacar que en la actualidad cualquier proyecto a nivel mun- dial que busque realizar investigación en genómica, transcriptómica, proteómica, metabolómica, y cualquiera de las otras ómicas, requiere de un fuerte apoyo de la bioinformática en el desarrollo e implementación de nuevas aplicaciones particulares que permitan rentabilizar la información generada, sobre todo si se considera que, con base en las respuestas obtenidas utilizando los desarrollos bioinformáticos, se avanzará mucho más rápido y con mayor confianza en la ex- perimentación biológica de cualquier tipo. Esto significa que no solamente se debe propiciar y financiar la investigación en el área de la bioinformática en Co- lombia que ha mostrado ser competitiva a nivel mundial independientemente de la experimentación biológica que se realiza en el país, sino que para hacer más competitiva la generación de conocimiento biológico debe ser integrada con igual jerarquía a las líneas de investigación, para darles la competitividad que requieren para su desarrollo. Lo anterior se hace más apremiante si consideramos que en este momento nues- tras líneas de investigación se ven enfrentadas, necesariamente, a la utilización técni- cas de alto rendimiento para la generación de datos biológicos, haciéndose necesario avanzar en la implementación de una plataforma bioinformática común para el ma- nejo sistemático de estos datos, en especial los que se obtienen de forma masiva por la aplicación de tecnologías en áreas como la genómica, transcriptómica, proteómica y metabolómica, coadyuvando a la disminución de los costos de desarrollo e imple- mentación de herramientas. Esta plataforma bioinformática implica implementar un sistema computacional de alto rendimiento, unido a una red de expertos en bioinformática trabajando coor- dinadamente en la detección de los problemas biológicos por resolver. Para tal efecto se requiere de la implementación de un centro especializado en bioinformática de alto rendimiento de cálculo y comunicación, de la formación de personal especializado en esta área, y de la adecuación o el desarrollo de las herramientas bioinformáticas específicas. Esta plataforma computacional deberá estar basada en la implementación de los desarrollos, productos y servicios seleccionados a partir de las necesidades de los diferentes grupos de investigación, de tal forma que se mantenga un intercambio permanente de necesidades y servicios con los grupos que se encargan de la genera- ción de los datos biológicos. Este centro podría tener un carácter virtual como ocurre con Instituto Suizo de Bioinformática, que como centro nacional coordina el desarrollo de los proyectos
  • 6. Bioinformática: una oportunidad y un desafío 137 de bioinformática en Suiza reuniendo a los expertos en el tema para provechar su experiencia en investigación y desarrollo en el área, y maximizar la infraestructura requerida, pero al mismo tiempo manteniéndolos vinculados con sus instituciones de origen (universidades e institutos de investigación) con el objeto de que siempre exista participación de éstos dentro de las líneas de investigación propias de cada institución. En nuestro caso se podría comenzar por la coordinación del recurso humano y técnico que, aunque limitado, actualmente existe en Colombia. Algunos grupos y centros de la Universidad del Valle, la Universidad Nacional de Colombia con grupos como el de Bioinformática del Instituto de Biotecnología encargado de la operación del Nodo Colombiano de la Red Europea de Biología Molecular (EMB- net), y Laboratorio de Investigación en Sistemas Inteligentes (LISI) de la Facultad de Ingeniería, Cenicafé, Universidad de los Andes, la FIDIC y la Universidad Jave- riana, entre otros, podrían combinar sus capacidades individuales para el beneficio de la comunidad académica que requiere de servicios, asesoría y capacitación en bioinformática. El futuro de la bioinformática en Colombia se erigirá sobre el esfuerzo que realicen los grupos de investigación de nuestro país, de manera conjunta, para trans- formar la información que se genera en el área biológica en conocimiento y desarrollo tecnológico. Agradecimientos A los miembros del Grupo de Bioinformática del Instituto de Biotecnología de la Universidad Nacional de Colombia, Sede Bogotá, y en especial a la profesora María Teresa Reguero R., por sus aportes y comentarios a la presente nota. Referencias bibliográficas Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. 1990. Basic local alignment search tool. J. Mol. Biol. 215: 403-410. Benson, D. A.; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L. 2008. GenBank. Nucleic Acids Res. 36 (Database issue): D25-30. BLA.id – Sistema de información sobre ß-lactamasas. 2008. Disponible en: http://bioinf.ibun.unal.edu.co/ BLA.id [Fecha de consulta: 10/05/2008, fecha actualización: 10/05/2008]. CNS - Centro Nacional de Supercomputación de España. 2008. Disponible en: www.bsc.es. [Fecha de con- sulta: 10/05/2008, fecha actualización: 10/05/2008]. EBI - European Bioinformatics Institute. 2008. Disponible en: www.ebi.ac.uk [Fecha de consulta: 10/05/2008, fecha actualización: 10/05/2008]. Guim, F.; Rodero, I.; Corbalan, J.; Labarta, J.; Oleksiak, A.; Nabrzyski, J. 2007. Uniform Job Monitoring in the HPC-Europa Project: Data Model, API and Services. International Journal of Web and Grid Services 3 (3). Hall, N. 2007. Advanced sequencing technologies and their wider impact in microbiology. J Exp Biol. 210 (9): 1518-1525.
  • 7. 138 Rev. Colomb. Biotecnol. Vol. X No. 1 Julio 2008 132-138 Mullis, K. B. 1990. Target Amplification for DNA analysis by the polymerase chain reaction. Ann. Biol. Clin. 48 (8): 579-82. Pham, T. D.; Wells, C.; Crane, D. 2006. Analysis of Microarray Gene Expression Data. Current Bioinfor- matics 1: 37-53. Reyes, S.; Muñoz-Caro, C.; Niño, A.; Badia, R. M.; Cela, J. M. 2007. Performance of computation-intensive, parameter sweep applications on Internet-based Grids of computers. The mapping of molecular poten- tial energy hypersurfaces. Concurrency and Computation: Practice and Experience 19 (4). The International Human Genome Sequencing Consortium. 2001. Initial sequencing and analysis of the human genome. Nature 409: 860-921.