SlideShare una empresa de Scribd logo
1 de 96
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Biología Molecular
 Es el estudio de la vida a un nivel molecular.
 Concierne principalmente al entendimiento de las interacciones de
los diferentes sistemas de la célula, lo que incluye muchísimas
relaciones, entre ellas las del ADN con el ARN, la síntesis de
proteínas, el metabolismo, y el cómo todas esas interacciones son
reguladas para conseguir un afinado funcionamiento de la célula.
 Pretende fijarse con preferencia en el comportamiento biológico de
las macromoléculas (ADN, ARN, enzimas, hormonas, etc.) dentro
de la célula y explicar las funciones biológicas del ser vivo por
estas propiedades a nivel molecular.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Célula
Unidad de Vida
Procariotas Vs. Eucariotas
“Es launidadvivamás pequeñacapaz decrecimiento autónomo yreproducción,
así como deutilizarsustancias alimenticias químicamentediferentes desí misma".
 Todos los sistemas biológicos tienen una serie de características comunes:
 capacidad de reproducción;
 capacidad de absorber sustancias nutritivas y metabolizarlas para obtener energía y
desarrollarse;
 capacidad de expulsar los productos de desecho;
 capacidad de respuesta a los estímulos del medio externo;
 capacidad de mutación.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Célula (cont.)
Unidad de Vida
Procariotas Vs. Eucariotas
 Todas las células vivas son fundamentalmente semejantes.
 Constituidas por el protoplasma
 Del griego 'protos' -primario- y 'plasma' -formación-.
 Complejo orgánico compuesto básicamente de proteínas, ácidos nucleicos, lípidos y polisacáridos.
 Debido a esto, es aceptado que todas las células descienden de algún antepasado común, de una célula
primordial.
 Rodeadas por membranas limitantes y algunas por paredes celulares.
 Poseen un núcleo o sustancia nucle ar e q uivale nte .
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Unidad de Vida
Procariotas Vs. Eucariotas
Se clasifica a los seres vivos en dos grandes grupos:
 Procariota (del griego pro = pre vio a y karyon = núcle o )
 Célula sin núcleo celular diferenciado (su ADN no se encuentra rodeado por
membranas).
 Primeras formas de vida sobre la tierra (aparecieron hace 3500 millones de
años).
 Básicamente, organismos unicelulares (x ej: bacterias).
 Eucariota (del griego eu = ve rdade ro y karyon = núcle o )
 Poseen un núcleo verdadero rodeado por membranas.
 Es típicamente mayor y estructuralmente más compleja que la procariota.
 Estos incluyen algas, protozoos, hongos, plantas superiores y animales.
Procariotas Vs. Eucariotas
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Procariotas Vs. Eucariotas (cont.)
Unidad de Vida
Procariotas Vs. Eucariotas
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Acidos nucleicos
Todas las células contienen la información necesaria para realizar distintas
reacciones químicas mediante las cuales las células crecen, obtienen energía y
sintetizan sus componentes.
 Esta información está almacenada en el material genético.
 Puede copiarse con exactitud para transmitir dicha información a las células
hijas.
 Estas instrucciones pueden ser modificadas levemente.
 Variaciones individuales: un individuo no es exactamente igual a otro de su misma especie
(distinto color de ojos, piel, etc.).
 En conclusión, el material genético es suficientemente maleable como para hacer posible la
evolución.
 La información genética o genoma, está contenida en unas moléculas llamadas
ácidos nucléicos. Existen dos tipos de ácidos nucléicos:
 el ADN, que guarda la información genética en todos los organismos celulares, y
 el ARN, que es necesario para que se exprese la información contenida en el ADN.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Acidos nucleicos
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
ADN – Acido desoxirribonucléico
 Provee el código genético que determina todas las características
individuales de las personas.
 En este código las unidades básicas de información son llamadas
bases (ó desoxiribonucleótidos) y son Adenina (A), Guanina (G),
Citosina (C) y Timidina (T).
 Estas bases se unen siempre de manera complementaria en la hebra de
ADN
 A siempre une con T, y C siempre une con G.
 La combinación de una base con su complementaria se la conoce
como par de bases.
 Está ubicado en el núcleo o espacio nuclear de las células.
 Suele encontrarse en un estado laxo o “relajado” llamado
cromatina.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
El Gen
 Es una secuencia determinada de bases (fragmento de ADN) que
contiene toda la información necesaria para producir una pro te ína.
 Es la unidad mínima que se puede heredar, o sea, que puede ser
tomada de uno de los progenitores para formar el nuevo individuo.
Si las caracte rísticas he re dable s (co m o e l aspe cto de la cara) las
de sco m po ne m o s e n o tras subcaracte rísticas (co lo r de lo s o jo s, co lo r de l
pe lo , te z), cuando ya no po dam o s dividir m ás e sas caracte rísticas de fo rm a
q ue sig an sie ndo he re dable s, dire m o s q ue e sa caracte rística e s de bida a un
g e n.
 El Gen tiene básicamente dos funciones:
1. reproducirse a sí mismo, e
2. indicar el modo de construcción y comportamiento de un nuevo ser vivo
completo.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
El Gen
 A g ro sso m o do , podemos dividir el gen en 5 regiones:
 una promotora: estimula o inhibe la expresión del gen,
 una de iniciación,
 una codificante (e xó n): parte que se expresará,
 una no codificante (intró n): no llegará a expresarse, y
 una de terminación.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Regulación de la expresión
Ya vimos que en el ADN (o los Ge ne s) se encuentra la información para la
construcción y comportamiento de un nuevo ser vivo completo.
Pero si además sabemos que todas las células de nuestro cuerpo poseen el
mismo material genético, ¿cómo es que cada célula expresa cosas diferentes?
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
En forma resumida, podemos decir que
cada parte de nuestro cuerpo posee
factores que estimulan el desarrollo de
las características de lo que deben ser e
inhiben aquellas que no se
correspondan.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Los Cromosomas
 Su número es constante para toda especie: el ser humano tiene 22 pares
autosómicos y 1 par sexual, o sea, 46 cromosomas por célula (con excepción
de las sexuales).
¿Qué son los cromosomas?
 Teóricamente, son los portadores de los factores de la herencia o genes.
 Físicamente, son pequeños cuerpos en forma de bastoncillos en que se
organiza la cromatina del núcleo celular durante las divisiones celulares.
¿Cuál es su función?
 Comprimir la información necesaria para la construcción de un ser vivo
completo.
Pero, ¿porqué comprimirla?
 La longitud del ADN de cada célula humana es de aproximadamente 2 metros.
Si se sumara la longitud del ADN de todas las células de una so la persona se
podría rodear la circunferencia terrestre 500,000 veces.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Compactación del ADN en un Cromosoma
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Integración de conceptos del ADN
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
ARN – Acido ribonucleico
 Es un intermediario para la expresión de la información contenida
en el ADN.
 En este código las unidades básicas de información son también
llamadas bases (ó ribonucleótidos) y son Adenina (A), Guanina (G),
Citosina (C) y Uracilo (U), este último equivalente a la base Timina
en el ADN.
 El ácido ribonucleico se forma por la polimerización de
ribonucleótidos. En general los ribonucleótidos se unen entre sí,
formando una cadena simple.
 La cadena simple de ARN puede plegarse y presentar regiones con
bases apareadas, de este modo se forman estructuras secundarias
del ARN, que tienen muchas veces importancia funcional, como por
ejemplo en los ARNt (ARN de transferencia).
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
ARN – Acido ribonucleico(cont.)
Se conocen tres tipos principales de ARN:
 ARN mensajero (ARNm)
 ARN de transferencia (ARNt)
 ARN ribosomal (ARNr)
 No entra en el alcance de la exposición.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
ARN mensajero (ARNm)
 Consiste en una molécula lineal de ribonucleótidos
(monocatenaria).
 Su secuencia de bases es complementaria a una porción de la
secuencia de bases del ADN.
 Las instrucciones residen en tripletes de bases a las que
llamaremos codones.
 Son los ARN más largos y pueden tener entre 1000 y 10000
nucleótidos.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
ARN de transferencia (ARNt)
 Es el más pequeño de todos, tiene aproximadamente 75 bases en su
cadena.
 Se pliega adquiriendo lo que se conoce con forma de hoja de trébol
plegada.
ADN – Acido desoxirribonucleico
El Gen
Regulación de la expresión
Los Cromosomas
Integración de conceptos del ADN
ARN – Acido ribonucleico
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Qué son las proteínas?
 Son las macromoléculas más abundantes en las células y
constituyen alrededor del 50% de su peso seco.
 Grupo de compuestos que mayor cantidad de funciones
desempeñan en los seres vivos, prácticamente no existe proceso
biológico en el que no participe por lo menos una proteína.
 Dentro de las células se las encuentra en formas muy variadas:
como constituyente de las membranas biológicas, como
catalizadores de reacciones metabólicas (enzimas), interactuando
con los ácidos nucleicos (histonas) o con neurotransmisores y
hormonas (receptores), etc.
¿Qué son las proteínas?
¿Qué hacen las proteínas?
¿Qué son los aminoácidos?
Clasificación de aminoácidos
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Qué hacen las proteínas?
 Algunos ejemplos de lo que las proteínas hacen:
 La enizma alco ho l de hidro g e nasa transforma el alcohol proveniente de
cerveza/vino/licor en una forma no tóxica que el cuerpo utiliza para comida.
 La he m o g lo bina transporta oxígeno en nuestra sangre.
 La fibrina forma una costra ó “cascarita” para proteger los cortes mientras curan.
 La insulina regula la cantidad de azúcar en sangre y es utilizada para tratar la diabetes.
 Las proteínas están presentes en todas las cosas vivas, inclusive en
plantas, bacterias y virus. Algunos organismos tienen proteínas que
les brindan sus características especiales:
 El fo to siste m a Ies una colección de proteínas en las plantas que capturan la luz solar
para poder realizar el proceso de fotosíntesis.
 La lucife rasa cataliza la reacción química que hace que la luciérnaga brille.
 La he m o ag lutinina ayuda al virus influe nza (de la gripe) a invadir nuestras células.
¿Qué son las proteínas?
¿Qué hacen las proteínas?
¿Qué son los aminoácidos?
Clasificación de aminoácidos
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Qué son los aminoácidos?
 Son la unidad estructural básica de las proteínas.
 Dos aminoácidos se combinan para forman un dipéptido. Si se une un tercer
aminoácido se forma un tripéptido y así, sucesivamente, para formar un polipéptido.
 Cuando las cadenas polipeptídicas superan los 40 aminoácidos se denominan
proteínas.
 Existen cientos de aminoácidos diferentes, pero sólo 20 son necesarios para poder
formar las proteínas.
 La proteína humana más grande conocida es Titina, que mide 34.350 aminoácidos.
¿Qué son las proteínas?
¿Qué hacen las proteínas?
¿Qué son los aminoácidos?
Clasificación de aminoácidos
 Estructura general: un carbono central unido a un
grupo carboxilo (rojo en la figura), a un grupo amino
(verde), a un hidrógeno (en negro) y a una cadena
lateral (azul).
 La diversidad de la cadena lateral caracteriza a
cada aminoácido.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Clasificación de aminoácidos
Existen muchas formas de clasificar los aminoácidos; las dos formas que se
presentan a continuación son las más comunes.
 Según su obtención
 Esenciales: son aquellos aminoácidos que necesitan ser ingeridos por el cuerpo para
obtenerlos.
 No esenciales.
 Según las propiedades de su cadena lateral
 Neutros polares, polares o hidrófilos.
 Neutros no polares, apolares o hidrófobos.
 Con carga negativa, o ácidos.
 Con carga positiva, o básicos.
 Aromáticos.
¿Qué son las proteínas?
¿Qué hacen las proteínas?
¿Qué son los aminoácidos?
Clasificación de aminoácidos
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
 P: ¿Cómo logra la naturaleza expresar en los organismos la información
contenida en el ADN?
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
Finalmente, y dicho técnicamente, llegamos al dogma central de la Biología
Molecular:
¿Cómo hace una molécula de ADN para codificaruna
proteína?
R: A través de las Proteínas.
 P: ¿Cómo se obtienen entonces las proteínas a partir del ADN?
R: Con la ayuda del ARN y a través de los procesos de transcripción y
traducción.
Dogma Central de la Biología Molecular
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Transcripción
 Es el proceso de transferencia de información de ADN en
ARNm.
 Ocurre entre dos alfabetos simples: el de ADN y el de ARN.
 Se realiza en el núcleo (eucariotas) o e spacio nucle ar
(procariotas).
 Se realiza a partir de la hebra molde de ADN (la 3’-5’).
 El ARNm resultante es de cadena simple, a diferencia de la
doble hélice formada por el ADN.
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
Traducción
 Es el proceso mediante el cual se forman las proteínas a
partir de los aminoácidos codificados por el ARNm.
 Ocurre en el citoplasma (básicamente, fuera del núcleo).
 Se da en 4 pasos*:
1. Activación.
2. Iniciación de la síntesis.
3. Elongación de la cadena polipeptídica.
4. Terminación de la síntesis.
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
* Analogía simple con la
construcción de un edificio:
1)obtener los materiales,
2)preparar los cimientos,
3)agregar pisos, y
4)Terminar (je! :D)
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
Pero, si existen 20 aminoácidos diferentes, ¿cómo se identifican si
sólo se tienen 4 bases distintas?
 Con 1 posición, 4 bases, se podrían obtener 4
aminoácidos. (No sirve, demasiado poco…)
 Con 2 posiciones, 4*4 combinaciones de bases, se
podrían obtener 16 aminoácidos. (Sigue sin alcanzar)
 Con 3 posiciones, 4*4*4 combinaciones de bases, se
podrían obtener 64 aminoácidos. (¡Bingo!)
El Código Genético
El código genético es el conjunto de reglas por las que la información codificada
en el material genético (secuencias de ADN o ARN) se traduce en proteínas
(secuencias de aminoácidos) en las células vivas.
 Define la relación entre secuencias de tres bases, llamadas codones, y
aminoácidos.
 Un codón se corresponde con un aminoácido específico.
 La secuencia del material genético se compone de cuatro bases
nitrogenadas distintas, que tienen una función equivalente a letras en el
código genético: A, T, C y G en el ADN y A, U, C y G en el ARN.
 Debido a esto, el número de codones posibles es 64.
 61 de ellos codifican aminoácidos (siendo además uno de ellos el codón de
inicio, AUG)
 los tres restantes son sitios de parada (e stop): UAA, UAG, UGA.
 La secuencia de codones determina la secuencia aminoacídica de una
proteína en concreto, que tendrá una estructura y una función específicas.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
 Universalidad
 El código genético es compartido por todos los organismos conocidos,
incluyendo virus y orgánulos (aunque pueden aparecer pequeñas diferencias).
 Este hecho indica que el código genético ha tenido un origen único en todos los
seres vivos conocidos.
 Continuidad
 Ningún codón codifica más de un aminoácido: de no ser así, conllevaría
problemas considerables para la síntesis de proteínas específicas para cada
gen.
 No presenta solapamiento: los tripletes se hallan dispuesto de manera lineal y
continua.
 Su lectura se hace en un solo sentido (5' - 3'), desde el codón de iniciación hasta
el codón de parada.
 Degeneración
 Que 61 codones codifiquen nada más que 20 aminoácidos hace del código
genético que sea redundante, lo que se denomina como código degenerado.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
El Código Genético: características
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
El Código Genético: tabla estándar
Secuencia de ADN
ATG
Secuencia de un triplete en
ADN
Secuencia de
ARN
AUG
Codón en
ARNm
Secuencia
aminoacídica
MET
Aminoácido en
proteína
Transcripción Traducción
Una analogía del Dogma llevada a la informática, más precisamente a un
programa de computadora:
Secuencia de ADN
Código Fuente
Secuencia de ARN
Código
precompilado
Secuencia
aminoacídica
Ejecutable
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
La Expresión Génica
Transcripción
Traducción
El Código Genético
Resumen
Resumiendo…
¡La estructura especifica la función
de la proteína!
Por ejemplo, una proteína que quiebre la glucosa de manera tal que la
célula pueda utilizar la energía almacenada en el azúcar tendría una
forma que reconociese a la glucosa y se le adhiriese (como llave y
cerradura) y aminoácidos químicamente reactivos que reaccionen con
la misma y la quiebren para liberar la energía.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Por qué es la forma tan importante?
¿Qué forma adoptará una proteína?
La estructura protéica
Ejemplos
¿Porqué es la forma tan importante?
 A pesar de que las proteínas sean simplemente una cadena
de aminoácidos, no les gusta mantenerse en una línea
estirada.
 La proteína se pliega hasta formar un globo compacto, pero
mientras lo va haciendo:
 deja algunos aminoácidos cerca del centro del mismo, y otros
hacia fuera; y
 mantiene algunos pares de aminoácidos bien cerca y otros bien
separados.
 Cada tipo de proteína se pliega en una muy forma específica,
y es siempre la misma.
 La mayoría de proteínas se pliegan por su cuenta, aunque
algunas necesitan alguna ayuda extra para plegarse en la
forma correcta.
 La forma única de una proteína particular es el estado más
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Por qué es la forma tan importante?
¿Qué forma adoptará una proteína?
La estructura proteica
Ejemplos
¿Qué forma adoptará una proteína?
La estructura de las proteínas puede
jerarquizarse en una serie de
niveles, interdependientes. Estos
niveles corresponden a:
1. Estructura primaria, que
corresponde a la secuencia de
aminoácidos.
2. Estructura secundaria, que provoca
la aparición de motivos
estructurales.
3. Estructura terciaria, que define la
estructura de las proteínas
compuestas por un sólo polipéptido.
4. Estructura cuaternaria, si interviene
más de un polipéptido.
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Por qué es la forma tan importante?
¿Qué forma adoptará una proteína?
La estructura proteica
Ejemplos
La estructura proteica
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Por qué es la forma tan importante?
¿Qué forma adoptará una proteína?
La estructura proteica
Ejemplos
Algunos ejemplos…
La he m o g lo bina es una proteína
tetramérica, que sirve como un buen
ejemplo de proteína con estructura
cuaternaria.
Representación de la
estructura proteica a
tres niveles: arriba, el
primario, compuesto
por los aminoácidos;
en el centro, el
secundario, definido
por las estructuras en
alfa hélice, beta
lámina y semejantes;
y abajo el terciario,
que detalla todos los
aspectos
volumétricos.
Dominio de unión a calcio de
calm o ldulina ; las esferas azules
representan al metal.
Algunos ejemplos…
Biología Molecular
La Célula
Acidos Nucleicos
Proteínas
Dogma Central de la Biología Molecular
Plegamiento de Proteínas
¿Por qué es la forma tan importante?
¿Qué forma adoptará una proteína?
La estructura proteica
Ejemplos
ElPro ble m a de lPle g ado de Pro te ínas
El problemadel Plegado deProteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Definicióndel problema
Motivación del enfoque computacional
En la actualidad, la co nfo rm ació n de una proteína, es
decir, la estructura final de la misma en el espacio
tridimensional, es comúnmente estudiada a través de
técnicas tales como la espectroscopia por resonancia
magnética nuclear (RMN) y la cristalografía con rayos X,
las cuales son costosas en términos de equipos,
procesamiento y tiempo.
Adicionalmente, el uso de estas técnicas requiere de
procesos previos de aislamiento, purificación y
cristalización de la proteína a estudiarse.
ElPro ble m a de lPle g ado de Pro te ínas
El problemadel Plegado deProteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Definicióndel problema
Motivación del enfoque computacional
Dada la complejidad y el costo de los factores antes
mencionados la predicción automática de dicha conformación a
partir de la secuencia de aminoácidos que componen la
proteína es uno de los problemas mas prominentes de la
bio lo g ía co m putacio nal.
Sin embargo, a pesar de lo atractivo del problema, de su
importancia práctica y del considerable progreso alcanzado en
las técnicas utilizadas hasta el momento, el rendimiento de los
mas avanzados métodos computacionales probados a la fecha
sigue siendo considerado insuficie nte .
El problemadel Plegado deProteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Definición del problema
Motivacióndel enfoquecomputacional
La dificultad de la resolución de este problema de
predicción tiene su origen en dos factores principales, a
saber:
1)El problema fundamental de, dada una estructura
candidata, tener un mecanismo adecuado de medición de
la calidad de dicha estructura, es decir, del nivel
energético de la misma.
Este pro ble m a ne ce sita se r re sue lto po r la bio q uím ica a
partir de le studio y m o de lado de lo s pro ce so s re ale s de
ple g ado pro te ico .
El problemadel Plegado deProteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Definición del problema
Motivacióndel enfoquecomputacional
1) El problema fundamental de, dada una estructura
candidata, tener un mecanismo adecuado de medición
de la calidad de dicha estructura, es decir, del nivel
energético de la misma.
2) Dada dicha medición, el problema de determinar las
estructuras óptimas o cercanas a la óptima para una
secuencia de aminoácidos.
Este pro ble m a e s una fue nte rica e inte re sante de
pro ble m as co m putacio nale s para o ptim iz ació n g lo baly
lo cal.
El problemadel Plegado deProteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Definición del problema
Motivacióndel enfoquecomputacional
Con el fin de lograr la se paració n entre
estos dos aspe cto s básico s , el problema
de la optimización es frecuentemente
estudiado a partir de m o de lo s
sim plificado s del problema original.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historiadel modelo
Sustento biológico
Modelo HP
Modelo 2D HP
 Los trabajos estudiados se enfocan en el modelo Hidrofóbico-Polar
en 2 dimensiones (2D HP por sus siglas en inglés), un modelo
extremadamente sim ple pero e xte nsam e nte utilizado para el
estudio de enfoques algorítmicos al problema de la predicción de
estructura proteica.
 Aún con este modelo simplificado, encontrar plegamientos óptimos
es computacionalmente difícil tanto para la versión en 2
dimensiones como para su variante en 3 dimensiones
(técnicamente hablando, es un problema NP-Hard tanto para el
modelo original como para muchas de las variaciones del mismo.
Berger & Leighton. 1998. N. Krasnogor et al. 1999).
 Debido a lo anterior los métodos de optimización heurísticos se
perfilan como algunos de los mas promisorios enfoques para
atacar el problema.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historiadel modelo
Sustento biológico
Modelos HP y 2D HP
 El m o de lo HP fue propuesto originalmente por Dill
(1985) y desarrollado luego por Lau & Dill (1989)
llevándolo estos a su planteamiento actual.
 En el trabajo de estos últimos se incorpora el
modelado de las moléculas como cadenas cortas
de aminoácidos en un re tículo cuadrado de dos
dimensiones (2D HP PFP).
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HP y 2D HP
 El modelo se basa en el enfoque te rm o dinám ico al
problema de la predicción de la estructura terciaria de las
proteínas y asume que las mismas buscan al ple g arse
m inim iz ar la cantidad de e ne rg ía utilizada por el sistema
llegando a un estado estable llamado e stado nativo .
 Mas aún, es generalmente aceptado por la comunidad
científica especializada -co n base e n lo s re sultado s
e m pírico s o bte nido s- que todas las proteínas naturales
tienen un estado nativo único . Esta hipótesis es conocida
como la Hipó te sis Te rm o dinám ica o el Do g m a de Anfinse n.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HP y 2D HP
 En particular, el modelo HP encuentra sustento biológico
adicional en resultados bien conocidos sobre el importante
rol de los aminoácidos hidrofóbicos y polares en la
estructura proteica final ya que la inte racció n hidro fó bica es
la fue rz a im pulso ra del plegado de proteínas y la
hidro fo bicidad de los aminoácidos la principalfue rza para el
desarrollo de la conformación nativa de pequeñas proteínas
globulares (Richards, 1977. Lau & Dill, 1989).
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 En el modelo HP, cada uno de los 20 aminoácidos es
clasificado como Hidro fó bico (H) o Po lar (P) en base a sus
características moleculares fundamentales.
 Basados en esta clasificación, cada se cue ncia de
am ino ácido s prim aria de una proteína (la cual puede ser
representada originalmente como una cadena de
caracteres de un alfabe to de 20 letras -una por cada
aminoácido-) es abstraida a una secuencia de residuos
hidro fó bico s o po lare s, es decir, a una cadena, de la misma
longitud que la original, pero con un alfabe to re ducido a
solo 2 letras (H y P, dependiendo de la clasificación del
aminoácido).
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
Eje m plo :
Esta conformación en particular representa a la secuencia:
HPHPPHHPHPPHPHHPPHPH.
Los cuadrados ne g ro s representan aminoácidos hidrofóbicos y los blanco s
simbolizan aminoácidos polares.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
Eje m plo :
El cuadrado negro indicado como con el Núm e ro 1 corresponde al elemento
s1 de la secuencia.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 Cabe mencionar que uno de los enfoques más comunes
para la predicción de estructuras proteicas es el de modelar
la e ne rg ía libre de un aminoácido dado dependiendo de su
conformación y a partir de allí encontrar conformaciones de
m inim ice n dicha energía.
 En el modelo HP, basados en la motivación biológica antes
descrita, la energía de una conformación está definida
como el número de contactos to po ló g ico s entre
aminoácidos hidrofóbicos que no son vecinos en la
secuencia dada.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 En el caso de la figura, las líneas co ntinuas representan el
camino seguido por la secuencia original y las líneas
punte adas representan los co ntacto s H-H necesarios para
el cálculo de energía según el método antes mencionado.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 En el caso de la figura, las líneas co ntinuas representan el
camino seguido por la secuencia original y las líneas
punte adas representan los co ntacto s H-H necesarios para
el cálculo de energía según el método antes mencionado.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 En el caso de la figura, las líneas co ntinuas representan el
camino seguido por la secuencia original y las líneas
punte adas representan los co ntacto s H-H necesarios para
el cálculo de energía según el método antes mencionado.
En la conformación del ejemplo la
energía tendría un valor de
-9, la cual se sabe que es óptima
para la secuencia utilizada
 Dada una secuencia de aminoácidos s = s1s2s3..,
encontrar una conformación de minimice la energía de s, es
decir, encontrar c* tal que E(c*) = min{E(c) | c e C} , donde
C(s) es el conjunto de todas las conformaciones válidas de
s.
El problema del Plegado de Proteínas
Modelo 2DHPPFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Historia del modelo
Sustento biológico
Modelos HPy2DHP
 Más específicamente, una conformación c con
e xactam e nte de tales co ntacto s H-H tiene una energía
libre )1()( −⋅= ncE
n
c
nssss ...21=
s
*c { }CccEcE ∈= |)(min*)(
s)(sC
 El problema de 2D HP PFP puede ser de finido entonces
mas formalmente de la siguiente manera:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 El Ant Co lo ny O ptim iz atio n (ACO por sus siglas en inglés)
es un enfoque basado en poblaciones para resolver
problemas de optimización combinatoria inspirado en la
naturaleza exploradora de las colonias de hormigas.
 El enfoque subyacente del ACO es el de un proceso
iterativo en el cual una población de agentes simples
(“hormigas”) construye repetidamente posibles soluciones a
los problemas abordados.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Este proceso de construcción está probabilísticamente
guiado tanto por info rm ació n he urística de la instancia dada
del problema como por una m e m o ria co m partida que
contiene la experiencia recolectada por las hormigas en
iteraciones previas (“rastro de fe ro m o na ”).
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 En el trabajo estudiado (A. Shmygelska et al. 2002) se
analiza un algoritmo ACO para resolver el problema de
Plegamiento de Proteínas usando el modelo 2D HP.
 Cabe mencionar que dicho trabajo fue seleccionado como
el mejor trabajo presentado durante elANTS 20 0 2: Fro m
Ant Co lo nie s to ArtificialAnts 3rd Inte rnatio nalWo rksho p o n
Ant Alg o rithm s – e lm ás im po rtante talle r inte rnacio nal
de dicado a aplicacio ne s de ACO - re alizado e n Bruse las,
Bé lg ica, e n Se ptie m bre de l20 0 2
 Seguidamente se analizan mejoras posteriores (por los mismos autores en
2003 y 2005) aplicadas a dicho algoritmo y se comparan los mismos con las
mejores soluciones algorítmicas conocidas en la actualidad para el mismo
problema o ligeras variaciones del mismo.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 En el trabajo se usan instancias del problema utilizadas por
implementaciones anteriores (usando otros métodos) según
muestra la siguiente tabla:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
Las hormigas del algoritmo construyen co nfo rm acio ne s
candidatas por medio del algoritmo ACO para una secuencia HP
de proteínas dada y luego aplica búsq ue da lo calpara lograr
mejores resultados.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Las co nfo rm acio ne s candidatas son representadas por medio de
m o tivo s de e structura lo cal(o direcciones de plegado relativas)
straig ht (S), le ft (L) y rig ht (R) los cuales indican, para cada
aminoácido, su posición siguiente en el retículo 2D con relación a
su predecesor directo tal como se muestra en la figura siguiente:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Ya que las conformaciones son invariante s co n re spe cto a las
ro tacio ne s, la posición de los primeros 2 aminoácidos de la
secuencia pueden ser fijados en cualesquiera dos lugares
adyacentes del retículo sin pérdida de generalidad.
 A partir de esta observación, se representan las conformaciones
candidatas para una secuencia proteica de longitud n por una
secuencia de motivos de estructura locales de longitud n-2.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo deHormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Por ejemplo, a la secuencia usada anteriormente
(HPHPPHHPHPPHPHHPPHPH), correspondería la secuencia de
motivos LSLLRRLRLLSLRRLLSL según se puede apreciar en la
siguiente figura:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 En la fase de construcción del algoritmo, cada hormiga determina
de manera aleatoria un punto de inicio dentro de la secuencia
proteica.
 Esto se hace eligiendo una posición de la secuencia entre 1 y n-1
de acuerdo a una distribució n ale ato ria unifo rm e y asignando
arbitrariamente al correspondiente aminoácido (H o P) y a su
sucesor directo dos posiciones vecinas dentro del retículo 2D.
 A partir de este punto de inicio cada secuencia es plegada en
ambas direcciones, añadiendo un aminoácido a la vez.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Las po sicio ne s re lativas hacia las cuales la conformación va
extendiéndose en cada caso se determinan aleatoriamente
usando una función heurística y valores de feromona (también
llamados intensidad del rastro).
 Estas direcciones relativas corresponden a m o tivo s e structurale s lo cale s entre triples de
secuencias consecutivas de las posiciones .i-1 s si+1que representan los componentes de la
solución obtenida a partir del ACO.
 Conceptualmente, estos m o tivo s juegan el mismo rol que las aristas (distancias) entre ciudades
en la aplicación clásica del ACO al TSP (Clásico Problema del Viajante de Comercio).
11 +− iii sss
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Al extender una conformación de la posición i hacia la derecha
colocando el aminoácido si+1en la retícula el algoritmo usa valores
de feromona ti,d y valores heurísticos ni,d donde d e {S, L, R}
es una dirección relativa.
 Los valores heurísticos utilizados ni,d deben guiar el proceso de
construcción hacia soluciones de alta calidad, esto es, hacia
conformaciones con un número máximo de interacciones H-H.
 En el algoritmo esto es logrado al definir ni,d basados en hi+1,, es
decir, en el número de nuevos contactos H-H obtenidos al colocar
si+1 en la dirección d relativa a si y si-1 cuando estamos plegando
hacia ade lante (y análogamente cuando se pliega hacia atrás)
i
1+is
{ }RLSd ,,∈
dih ,1+
is 1−is
1+is
di,τ di,η
di,η
di,η
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Nótese que si Si+1 = P, este aminoácido no puede contribuir a
ningún nuevo contacto H-H por lo cual hi,S = hi, L = hi, R. . Más
aún, para 1 < i < n- 1, hi,d <= 2 y .
 En cada caso, los valores de hi,d pueden ser fácilmente
determinados revisando los 7 posibles vecinos de la posible
solución de si+1 en la retícula (obviamente la posición de si esta
ocupada y no debe ser tomada en cuenta).
 Los valores heurísticos son entonces definidos como ni ,d = hi,d ,
esto asegura que ni,d > 0 para todos los i y d, lo cual es
importante ya que impide excluir a prio ri algún lugar de Si+ en el
proceso de construcción.
Psi =+1
0,,, === RiLiSi hhh
11 −<< ni 2, ≤dih3,1 ≤− dnh
dih ,
1+is
1,, += didi hη
0, >diη
1+is is
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Al extender una conformación parcial sk...s i hacia si+1 durante el
proceso de construcción del algoritmo ACO, la dirección relativa d
de Si+1 con respecto a s i-1si esta determinada basada en la
heurística y los valores de feromona de acuerdo a las siguientes
probabilidades:
ik ss ... 1+is
1−is1+is
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 A partir de su punto de inicio aleatoriamente determinado l, cada
hormiga primero construye una conformación parcial s..l...s1 y
luego otra sl...sn.
 Se probaron variantes del algoritmo en la cuales todas las
hormigas iniciaban el proceso de construccion desde el mismo
punto (inicio, medio y fin de la secuencia).
l
1...ssl
nl ss ...
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Especialmente en el caso de secuencias largas, es frecuente
encontrar conformaciones infactible s durante el proceso de
construcción. Esto pasa si una conformación inco m ple ta no puede
ser e xte ndida mas allá de una posición de la retícula por estar
ocupados todos las posiciones vecinas de dicha posición.
 El algoritmo usa dos mecanismos para solucionar este problema:.
 Prim e ro , usa un sencillo mecanismo de "mirar hacia adelante" al
nunca permitir que un aminoácido "interno" si (1 < i < n) sea
colocado en un lugar tal que todas sus posiciones vecinas en la
retícula están ocupadas (esto es barato computacionalmente ya
que puede ser chequeado fácilmente durante el cálculo del valor
heurístico).
)1( nisi <<
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fasedeconstrucción, feromonayvalores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Se g undo , si durante un paso de la construcción todas las
posiciones de si son descartadas por el mecanismo anterior, se
retrocede hasta la m itad de la distancia ya plegada y se reinicia el
proceso de construcción desde la posición respectiva en la
secuencia.
 Es interesante notar que se probaron varias modificaciones a este
mecanismo de retroceso y que se utilizó esta basados en que
probó ser razonablemente rápida y efectiva.
is
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
BúsquedaLocal
Actualización de feromona
Resultados obtenidos
 De manera similar a lo utilizado en otros algoritmos ACO
conocidos, el algoritmo estudiado incorpora una fase de búsqueda
local.
 En esta, después de cada fase de construcción, cada hormiga
aplica una búsqueda local híbrida de mejora iterativa para su
conformación candidata respectiva.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualizacióndeferomona
Resultados obtenidos
 Después de cada fase de construcción y búsqueda local, hormigas
seleccionadas actualizan los valores de feromona según el método
estándar:
Donde es la persistencia de la feromona (un parámetro
que determina que tan rápido la información recolectada en
iteraciones previas es “olvidada”) y .............es la calidad relativa
de la solución para la conformación candidata c de la hormiga
dada si tal conformación contiene un motivo de estructura local d
en la secuencia en la posición i y ce ro en caso contrario.
 Esto garantiza que la probabilidad de elegir un m o tivo de
e structura lo calpara la correspondiente posición en la secuencia
no se vuelva arbitrariamente pequeña.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualizacióndeferomona
Resultados obtenidos
 Se usa una formula de calidad relativa para cada solución dada por
E(c) / E* donde E* es la energía mínima conocida para la secuencia de
proteínas dada (o una aproximación basada en el numero de residuos H
de la secuencia), esto para prevenir e stancam ie nto pre m aturo en la
búsqueda para secuencias con valores energéticos altos.
 Como un mecanismo adicional para prevenir estancamiento se
usa un método de renormalización de los valores de feromona
conceptualmente similar al método usado en el Sistema de
Hormigas MAX-MIN (Stutzle & Hoos, 1997).
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como mencionamos con anterioridad, el algoritmo fue probado en
9 instancias de prueba estándar, a saber:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como puede verse a partir de la tabla, el algoritmo encontró soluciones
óptimas para todas menos para las dos secuencias más largas de las
instacias de prueba utilizadas.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 También puede observarse la comparación efectuada entre el algoritmo con
búsqueda local y só lo la búsqueda local. Se puede ver que en todos los casos
fue mejor y mas rápida la combinacion de ambas cosas con lo cual se aisla el
valor propio del algoritmo sin la búsqueda local.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Los experimentos fueron conducidos realizando un número
variable de corridas para cada instancia del problema; cada
corrida fue terminada cuando no fue encontrada mejora en la
calidad de la solución en 10,000 ciclos del algoritmo.
 Se usaron 10 hormigas para secuencias pequeñas (s <= 25) y 10-
15 para secuencias mas largas.
 
Se fijaron los valores de los parám e tro s básico s del algoritmo en:
Co n re spe cto a lo s de talle s de la im ple m e ntació n:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 El procedimiento de búsqueda local fue terminado cuando no se
observaba mejora a la solución después de 100-300 pasos de la
búsqueda.
 Se usó un método de actualización de feromona e litista en el cual
solo el 20% mejor de las conformaciones obtenidas después de la
fase de búsqueda local fue usada.
 
Adicionalmente, la mejor conformación global fue utilizada para
actualizar el valor de feromona cuando no fue encontrada una mejora
a la mejor solución global dentro de 20-50 ciclos.
Co n re spe cto a lo s de talle s de la im ple m e ntació n:
 El tiempo de ejecución fue medido en términos de tiempo de CPU
y todos los experimentos fueron realizados en PCs con procesador
Pentium III a 1 GHz, 256KB de cache y 1GB de RAM.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 El procedimiento de búsqueda local fue terminado cuando no se
observaba mejora a la solución después de 100-300 pasos de la
búsqueda.
 Se uso un método de actualización de feromona elitista en el cual
solo el 20% mejor de las conformaciones obtenidas después de la
fase de búsqueda local fue usada.
 
Adicionalmente, la mejor conformación global fue utilizada para
actualizar el valor de feromona cuando no fue encontrada una mejora
a la mejor solución global dentro de 20-50 ciclos.
Co n re spe cto a lo s de talle s de la im ple m e ntació n:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como puede verse a partir de la tabla, el algoritmo encontró soluciones
óptimas para todas menos para las dos secuencias más largas de las
instancias de prueba utilizadas.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Una gráfica de mediciones de run-time distributions (RTD) fue utilizada
basada en los trabajos que en esta metodología hicieron Hoos y Stutzle
(2000) para aquellas secuencias en las que se obtuvo el valor óptimo más
de una vez. Los resultados se pueden apreciar en la siguiente grafica:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 En la gráfica puede observarse evidencia de e stancam ie nto en las
secuencias mas largas; en el trabajo se sugiere que en estos casos una
mejor heurística y/o una mejor búsqueda local podrían mejorar los
resultados obtenidos.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Buscando evaluar el beneficio de usar una po blació n de ho rm ig as en lugar
de una sola hormiga se estudió el im pacto de variar el número de hormigas
para el algoritmo. Si bien usando una sola hormiga se obtuvieron buenos
resultados para instancias pequeñas (n <= 25) la mejor solución al
problema 4 (n=36) no pudo ser encontrado después de una corrida de 2
horas de CPU.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como en otros casos donde ha sido utilizado el algoritmo, en esta caso
también la estrategia de actualización de feromona basada en un criterio
elitista también parece aplicar a este problema: Se probaron 3 tipos de
actualizaciones diferentes:
1) Todas las hormigas.
2) Todas las hormigas con refuerzo para el 20% mejor de las hormigas.
3) Solo el 20% mejor de las hormigas.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Los resultados obtenidos pueden ser apreciados en la siguiente gráfica:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como puede verse, los mejores resultados fueron obtenidos a partir de las
estrategias donde se actualizaba a partir de los resultados (únicos o
reforzados) del mejor 20% de las hormigas.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Esto sugiere que la intensificación en la búsqueda provista por la
estrategia antes mencionada se requiere para alcanzar un buen
rendimiento en el algoritmo ACO utilizado.
 Al mismo tiempo, experimentos adicionales no reportados en el
trabajo pero mencionados en el, indican que el mecanimo de
renormalizacion de feromona es crucial para resolver instancias
grandes del problema, lo cual subraya la importancia de la
diversificación de la búsqueda (escape de mínimos locales).
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 El siguiente análisis estudio la importancia relativa de la heurística contra la
de la feromona. Los resultados se muestran en la siguiente grafica:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Como puede apreciarse, en principio ambos valores probaron ser
importantes en los resultados obtenidos.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Es interesante observar que eliminar la influencia de la feromona es más
perjudicial que eliminar la influencia de la heurística aún para casos
pequeños. Este fenómeno se hace más pronunciado a medida que se
intentan resolver instancias mayores del problema.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 Finalmente, se estudiaron el efecto del punto de inicio en la construcción de
las conformaciones en el rendimiento final del algoritmo.
 Con tal fin, se probaron 4 e strate g ias para determinar la posición inicial
desde el cual iniciar las conformaciones en la etapa de construcción del
algoritmo:
1) Todas las hormigas pliegan hacia ade lante iniciando en la posición 1.
2) Todas las hormigas pliegan hacia atrás iniciando en la posición n
3) Todas las hormigas pliegan hacia ade lante y hacia atrás iniciando en
la mitad de la secuencia
4) Todas las hormigas pliegan hacia ade lante y hacia atrás iniciando en
posiciones aleatoriamente determinadas de la secuencia.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACOaplicado a2DHPPFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algoritmo de Hormigas
Fase de construcción, feromona y valores heurísticos
Búsqueda Local
Actualización de feromona
Resultados obtenidos
 La cuarta estrategia, es decir, la de que cada hormiga iniciara en una posición de la
secuencia elegida aleatoriamente y de allí plegara en un sentido y luego en el otro,
mostró ser con mejor que las demás. Esta diferencia es aún mayor en secuencias
mas largas y sugiere que la diversificación de la búsqueda aportada por múltiples y
diversos puntos de inicio es importante para lograr un buen rendimiento.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas alACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Trabajos posteriores
ACO 2003 y 2005
 Como una de las conclusiones del trabajo presentado (2002) se menciona
que si bien no se pudieron mejorar los logros de los m e jo re s alg o ritm o s
co no cido s para las instancias del problema estudiadas, los resultados eran
muy alentadores y la implementación dejaba sin lugar a dudas enseñanzas
valiosas que podrían aprovecharse en trabajos futuros.
 Estos resultados no tardaron en llegar ya que el mismo grupo de
investigación (liderado por Shmygelska y Hoos) siguieron trabajando en
mejoras sucesivas al algoritmo con resultados muy interesantes.
 En particular se presentaron trabajos en el 2003 y el 2005, siendo los
resultados de este último casi tan buenos como los mejores algoritmos
conocidos hasta el momento.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas alACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Trabajos posteriores
ACO2003y2005
 Algunas de las mejoras que se fueron incorporando al algoritmo original incluyen:
• Método de búsqueda local (2003 y 2005)
• Estrategia para avanzar en el plegado hacia adelante o hacia atrás (2003)
• Ho rm ig as de m e jo ra aplicadas no solo al mecanismo global sino también a las mejoras locales (2003)
• Mucho mayor cantidad de hormigas (2003, 2005)
• Se incorporan soluciones de muy alto rendimiento al problema en su versión 3D (2005)
• Definición de la fórmula heurística basada ahora en la distribución de Boltzman (2005)
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Otros Algoritmos
 Existe una gran cantidad de trabajos para resolver el 2D HP PFP con un
enfoque computacional.
 Entre estos se incluyen: Enfoques desde los algoritmos geneticos,
variantes y enfoques clásicos del método de Monte Carlo (siendo uno de
estos, el llamado PERM –Prune Enrichement Rosenbluth Method, acaso la
solución computacionalmente más exitosa entre las que se conocen)
Algoritmos con Tabu Seach, Simulated Annealing, etc. además de varios
métodos de solución específicos al problema.
 Es importante notar que el problema ha sido además extensamente
atacado en años recientes por lo cual es dificil entender en cada momento
cual es la mejor implementación de todas aún para las instancias más
comunes del problema.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Otros Algoritmos
 De una novedosa implementación reciente (Filter-and-Fan approach. Rego
et al. 2006) obtuvimos una tabla más o menos reciente con los mejores
algoritmos en ese momento:
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
Algunas aplicaciones biológicas
Algunas aplicaciones biológicas
La era de las “OMICs” de la Biología Molecular
Acoplamiento proteína-proteína Anotación de genomas
Análisis de imagen de alto
rendimiento
Biología evolutiva computacional
Análisis de la expresión de proteínas Genómica comparativa
Análisis de la expresión génica Medición de la biodiversidad
Análisis de la regulación Modelado de sistemas biológicos
Análisis de mutaciones en el cáncer Predicción de la estructura de las
proteínas
Análisis de secuenciasHoy en día, son cada vez más los congresos, tales como el MAEB (Co ng re so
so bre Me tahe urísticas, Alg o ritm o s Evo lutivo s y Bio inspirado s ), que tienen
como principal objetivo reflejar el estado del arte respecto al uso de las
técnicas metaheurísticas y bioinspiradas en aplicaciones biológicas y/o
biomédicas.
El problema del Plegado de Proteínas
Modelo 2D HP PFP
ACO aplicado a 2D HP PFP
Mejoras sucesivas al ACO
Otros algoritmos aplicados
Otros Problemas de la Bioinformática
La era de las “OMICs” de la Biología Molecular
 Genómica (Genomics): estudio de los genomas de los organismos (secuenciación,
mapeo e interacciones génicas).
 Proteómica (Proteomics): estudio de todo el complemento proteico en un sistema u
organismo.
 Transcriptómica (Transcriptomics): todos los ARN mensajeros (ARNm) o
"transcriptos", producidos por una célula o un conjunto de células.
 Metabolómica (Metabolomics): mapa completo de todos los metabolitos moleculares
pequeños en el cuerpo humano (metaboloma humano)
 Genómica Estructural (Structural Genomics): determinación de la estructura 1D, 2D y
3D de todas las proteínas en un organismo dado.
 Informática (Informatics): aplicación de tecnología de la información al campo de la
Biología Molecular.
 Farmacogenómica (Pharmacogenomics): identifica las bases genéticas para la
herencia y variación interindividual en respuesta a drogas.
Algunas aplicaciones biológicas
La era de las “OMICs” de la Biología Molecular

Más contenido relacionado

La actualidad más candente

Genetica molecular
Genetica molecularGenetica molecular
Genetica molecularjesus larios
 
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓN
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓNREGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓN
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓNShadenVegaSalazar
 
Bloque iii division celular envio
Bloque iii division celular envioBloque iii division celular envio
Bloque iii division celular envioclauciencias
 
Genetica 1-apuntes-4
Genetica 1-apuntes-4Genetica 1-apuntes-4
Genetica 1-apuntes-4HAROLD JOJOA
 
El material genético
El material genéticoEl material genético
El material genéticoalablog
 
Bases moleculares de la ing. genetica
Bases moleculares de la ing. geneticaBases moleculares de la ing. genetica
Bases moleculares de la ing. geneticaKaren Alex
 
Bases fisicas de la herencia. La celula.
Bases fisicas de la herencia. La celula.Bases fisicas de la herencia. La celula.
Bases fisicas de la herencia. La celula.Paola Oropeza
 
Biologia celular y molecular
Biologia celular y molecularBiologia celular y molecular
Biologia celular y molecularmolbio1984
 
Material genético y división celular
Material genético y división celularMaterial genético y división celular
Material genético y división celularNicolas Gallardo
 
Núcleo y material genetico
Núcleo y material geneticoNúcleo y material genetico
Núcleo y material geneticofelipeultimate
 
Biologia molecular adn parte 1
Biologia molecular adn parte 1Biologia molecular adn parte 1
Biologia molecular adn parte 1Angelica Delgado
 
Epigenetica la-esencia-del-cambio.-como ves-pdf
Epigenetica la-esencia-del-cambio.-como ves-pdfEpigenetica la-esencia-del-cambio.-como ves-pdf
Epigenetica la-esencia-del-cambio.-como ves-pdfclauciencias
 

La actualidad más candente (20)

Genetica molecular
Genetica molecularGenetica molecular
Genetica molecular
 
Material Genetico
Material GeneticoMaterial Genetico
Material Genetico
 
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓN
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓNREGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓN
REGULACIÓN GENÓMICA, CÉLULAS MADRE, CLONACIÓN
 
Tema 4
Tema 4Tema 4
Tema 4
 
Bloque iii division celular envio
Bloque iii division celular envioBloque iii division celular envio
Bloque iii division celular envio
 
Material genético
Material genéticoMaterial genético
Material genético
 
Unidades genetica
Unidades geneticaUnidades genetica
Unidades genetica
 
ADN presentacion
ADN presentacion ADN presentacion
ADN presentacion
 
material genético
material genético material genético
material genético
 
Genetica 1-apuntes-4
Genetica 1-apuntes-4Genetica 1-apuntes-4
Genetica 1-apuntes-4
 
El material genético
El material genéticoEl material genético
El material genético
 
Bases moleculares de la ing. genetica
Bases moleculares de la ing. geneticaBases moleculares de la ing. genetica
Bases moleculares de la ing. genetica
 
Bases fisicas de la herencia. La celula.
Bases fisicas de la herencia. La celula.Bases fisicas de la herencia. La celula.
Bases fisicas de la herencia. La celula.
 
Genetica molecular
Genetica molecularGenetica molecular
Genetica molecular
 
Biologia celular y molecular
Biologia celular y molecularBiologia celular y molecular
Biologia celular y molecular
 
R613
R613R613
R613
 
Material genético y división celular
Material genético y división celularMaterial genético y división celular
Material genético y división celular
 
Núcleo y material genetico
Núcleo y material geneticoNúcleo y material genetico
Núcleo y material genetico
 
Biologia molecular adn parte 1
Biologia molecular adn parte 1Biologia molecular adn parte 1
Biologia molecular adn parte 1
 
Epigenetica la-esencia-del-cambio.-como ves-pdf
Epigenetica la-esencia-del-cambio.-como ves-pdfEpigenetica la-esencia-del-cambio.-como ves-pdf
Epigenetica la-esencia-del-cambio.-como ves-pdf
 

Similar a Bio molecular

Similar a Bio molecular (20)

La genética molecular
La genética molecular La genética molecular
La genética molecular
 
Adn .orgànulos eucariotas
Adn .orgànulos eucariotasAdn .orgànulos eucariotas
Adn .orgànulos eucariotas
 
Adn b
Adn bAdn b
Adn b
 
Adn b
Adn bAdn b
Adn b
 
ESTRUCTURA DEL ADN Y DEL GENOMA HUMANO SANTIAGO ANDRADE
ESTRUCTURA DEL ADN Y DEL GENOMA HUMANO SANTIAGO ANDRADEESTRUCTURA DEL ADN Y DEL GENOMA HUMANO SANTIAGO ANDRADE
ESTRUCTURA DEL ADN Y DEL GENOMA HUMANO SANTIAGO ANDRADE
 
C:\Documents And Settings\Usuario\Escritorio\Adn
C:\Documents And Settings\Usuario\Escritorio\AdnC:\Documents And Settings\Usuario\Escritorio\Adn
C:\Documents And Settings\Usuario\Escritorio\Adn
 
PPT de Genética
PPT de GenéticaPPT de Genética
PPT de Genética
 
EMBRIOLOGIA Y GENETICA- genoma y mitocondria.pptx
EMBRIOLOGIA Y GENETICA- genoma y mitocondria.pptxEMBRIOLOGIA Y GENETICA- genoma y mitocondria.pptx
EMBRIOLOGIA Y GENETICA- genoma y mitocondria.pptx
 
ley de mendel
ley de mendelley de mendel
ley de mendel
 
modulo II- Clase 2
modulo II- Clase 2modulo II- Clase 2
modulo II- Clase 2
 
El genoma humano
El genoma humanoEl genoma humano
El genoma humano
 
El genoma humano
El genoma humanoEl genoma humano
El genoma humano
 
La revolución genética
La revolución genéticaLa revolución genética
La revolución genética
 
Unidad%2010%20LOS%20GENES.pptx
Unidad%2010%20LOS%20GENES.pptxUnidad%2010%20LOS%20GENES.pptx
Unidad%2010%20LOS%20GENES.pptx
 
8[1]. SALUD DE UNA ARTICULO DE INVESTIGACIÓ
8[1]. SALUD DE UNA ARTICULO DE INVESTIGACIÓ8[1]. SALUD DE UNA ARTICULO DE INVESTIGACIÓ
8[1]. SALUD DE UNA ARTICULO DE INVESTIGACIÓ
 
Estructura del genoma
Estructura del genomaEstructura del genoma
Estructura del genoma
 
Célula y herencia
Célula y herenciaCélula y herencia
Célula y herencia
 
"Nucleo celular y material genetico" Biologia
"Nucleo celular y material genetico" Biologia"Nucleo celular y material genetico" Biologia
"Nucleo celular y material genetico" Biologia
 
Genetica humana ucn JACG
Genetica humana ucn JACGGenetica humana ucn JACG
Genetica humana ucn JACG
 
Célula y herencia
Célula y herenciaCélula y herencia
Célula y herencia
 

Último

RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxpvtablets2023
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptxRigoTito
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptNancyMoreiraMora1
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...jlorentemartos
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIAFabiolaGarcia751855
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxBeatrizQuijano2
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalJonathanCovena1
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesMarisolMartinez707897
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024IES Vicent Andres Estelles
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxNadiaMartnez11
 

Último (20)

RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
 

Bio molecular

  • 1. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Biología Molecular  Es el estudio de la vida a un nivel molecular.  Concierne principalmente al entendimiento de las interacciones de los diferentes sistemas de la célula, lo que incluye muchísimas relaciones, entre ellas las del ADN con el ARN, la síntesis de proteínas, el metabolismo, y el cómo todas esas interacciones son reguladas para conseguir un afinado funcionamiento de la célula.  Pretende fijarse con preferencia en el comportamiento biológico de las macromoléculas (ADN, ARN, enzimas, hormonas, etc.) dentro de la célula y explicar las funciones biológicas del ser vivo por estas propiedades a nivel molecular.
  • 2. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Célula Unidad de Vida Procariotas Vs. Eucariotas “Es launidadvivamás pequeñacapaz decrecimiento autónomo yreproducción, así como deutilizarsustancias alimenticias químicamentediferentes desí misma".  Todos los sistemas biológicos tienen una serie de características comunes:  capacidad de reproducción;  capacidad de absorber sustancias nutritivas y metabolizarlas para obtener energía y desarrollarse;  capacidad de expulsar los productos de desecho;  capacidad de respuesta a los estímulos del medio externo;  capacidad de mutación.
  • 3. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Célula (cont.) Unidad de Vida Procariotas Vs. Eucariotas  Todas las células vivas son fundamentalmente semejantes.  Constituidas por el protoplasma  Del griego 'protos' -primario- y 'plasma' -formación-.  Complejo orgánico compuesto básicamente de proteínas, ácidos nucleicos, lípidos y polisacáridos.  Debido a esto, es aceptado que todas las células descienden de algún antepasado común, de una célula primordial.  Rodeadas por membranas limitantes y algunas por paredes celulares.  Poseen un núcleo o sustancia nucle ar e q uivale nte .
  • 4. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Unidad de Vida Procariotas Vs. Eucariotas Se clasifica a los seres vivos en dos grandes grupos:  Procariota (del griego pro = pre vio a y karyon = núcle o )  Célula sin núcleo celular diferenciado (su ADN no se encuentra rodeado por membranas).  Primeras formas de vida sobre la tierra (aparecieron hace 3500 millones de años).  Básicamente, organismos unicelulares (x ej: bacterias).  Eucariota (del griego eu = ve rdade ro y karyon = núcle o )  Poseen un núcleo verdadero rodeado por membranas.  Es típicamente mayor y estructuralmente más compleja que la procariota.  Estos incluyen algas, protozoos, hongos, plantas superiores y animales. Procariotas Vs. Eucariotas
  • 5. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Procariotas Vs. Eucariotas (cont.) Unidad de Vida Procariotas Vs. Eucariotas
  • 6. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Acidos nucleicos Todas las células contienen la información necesaria para realizar distintas reacciones químicas mediante las cuales las células crecen, obtienen energía y sintetizan sus componentes.  Esta información está almacenada en el material genético.  Puede copiarse con exactitud para transmitir dicha información a las células hijas.  Estas instrucciones pueden ser modificadas levemente.  Variaciones individuales: un individuo no es exactamente igual a otro de su misma especie (distinto color de ojos, piel, etc.).  En conclusión, el material genético es suficientemente maleable como para hacer posible la evolución.  La información genética o genoma, está contenida en unas moléculas llamadas ácidos nucléicos. Existen dos tipos de ácidos nucléicos:  el ADN, que guarda la información genética en todos los organismos celulares, y  el ARN, que es necesario para que se exprese la información contenida en el ADN. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 7. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Acidos nucleicos ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 8. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ADN – Acido desoxirribonucléico  Provee el código genético que determina todas las características individuales de las personas.  En este código las unidades básicas de información son llamadas bases (ó desoxiribonucleótidos) y son Adenina (A), Guanina (G), Citosina (C) y Timidina (T).  Estas bases se unen siempre de manera complementaria en la hebra de ADN  A siempre une con T, y C siempre une con G.  La combinación de una base con su complementaria se la conoce como par de bases.  Está ubicado en el núcleo o espacio nuclear de las células.  Suele encontrarse en un estado laxo o “relajado” llamado cromatina. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 9. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas El Gen  Es una secuencia determinada de bases (fragmento de ADN) que contiene toda la información necesaria para producir una pro te ína.  Es la unidad mínima que se puede heredar, o sea, que puede ser tomada de uno de los progenitores para formar el nuevo individuo. Si las caracte rísticas he re dable s (co m o e l aspe cto de la cara) las de sco m po ne m o s e n o tras subcaracte rísticas (co lo r de lo s o jo s, co lo r de l pe lo , te z), cuando ya no po dam o s dividir m ás e sas caracte rísticas de fo rm a q ue sig an sie ndo he re dable s, dire m o s q ue e sa caracte rística e s de bida a un g e n.  El Gen tiene básicamente dos funciones: 1. reproducirse a sí mismo, e 2. indicar el modo de construcción y comportamiento de un nuevo ser vivo completo. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 10. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas El Gen  A g ro sso m o do , podemos dividir el gen en 5 regiones:  una promotora: estimula o inhibe la expresión del gen,  una de iniciación,  una codificante (e xó n): parte que se expresará,  una no codificante (intró n): no llegará a expresarse, y  una de terminación. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 11. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Regulación de la expresión Ya vimos que en el ADN (o los Ge ne s) se encuentra la información para la construcción y comportamiento de un nuevo ser vivo completo. Pero si además sabemos que todas las células de nuestro cuerpo poseen el mismo material genético, ¿cómo es que cada célula expresa cosas diferentes? ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico En forma resumida, podemos decir que cada parte de nuestro cuerpo posee factores que estimulan el desarrollo de las características de lo que deben ser e inhiben aquellas que no se correspondan.
  • 12. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Los Cromosomas  Su número es constante para toda especie: el ser humano tiene 22 pares autosómicos y 1 par sexual, o sea, 46 cromosomas por célula (con excepción de las sexuales). ¿Qué son los cromosomas?  Teóricamente, son los portadores de los factores de la herencia o genes.  Físicamente, son pequeños cuerpos en forma de bastoncillos en que se organiza la cromatina del núcleo celular durante las divisiones celulares. ¿Cuál es su función?  Comprimir la información necesaria para la construcción de un ser vivo completo. Pero, ¿porqué comprimirla?  La longitud del ADN de cada célula humana es de aproximadamente 2 metros. Si se sumara la longitud del ADN de todas las células de una so la persona se podría rodear la circunferencia terrestre 500,000 veces. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 13. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Compactación del ADN en un Cromosoma ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 14. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Integración de conceptos del ADN ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 15. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ARN – Acido ribonucleico  Es un intermediario para la expresión de la información contenida en el ADN.  En este código las unidades básicas de información son también llamadas bases (ó ribonucleótidos) y son Adenina (A), Guanina (G), Citosina (C) y Uracilo (U), este último equivalente a la base Timina en el ADN.  El ácido ribonucleico se forma por la polimerización de ribonucleótidos. En general los ribonucleótidos se unen entre sí, formando una cadena simple.  La cadena simple de ARN puede plegarse y presentar regiones con bases apareadas, de este modo se forman estructuras secundarias del ARN, que tienen muchas veces importancia funcional, como por ejemplo en los ARNt (ARN de transferencia). ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 16. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ARN – Acido ribonucleico(cont.) Se conocen tres tipos principales de ARN:  ARN mensajero (ARNm)  ARN de transferencia (ARNt)  ARN ribosomal (ARNr)  No entra en el alcance de la exposición. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 17. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ARN mensajero (ARNm)  Consiste en una molécula lineal de ribonucleótidos (monocatenaria).  Su secuencia de bases es complementaria a una porción de la secuencia de bases del ADN.  Las instrucciones residen en tripletes de bases a las que llamaremos codones.  Son los ARN más largos y pueden tener entre 1000 y 10000 nucleótidos. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 18. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ARN de transferencia (ARNt)  Es el más pequeño de todos, tiene aproximadamente 75 bases en su cadena.  Se pliega adquiriendo lo que se conoce con forma de hoja de trébol plegada. ADN – Acido desoxirribonucleico El Gen Regulación de la expresión Los Cromosomas Integración de conceptos del ADN ARN – Acido ribonucleico
  • 19. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Qué son las proteínas?  Son las macromoléculas más abundantes en las células y constituyen alrededor del 50% de su peso seco.  Grupo de compuestos que mayor cantidad de funciones desempeñan en los seres vivos, prácticamente no existe proceso biológico en el que no participe por lo menos una proteína.  Dentro de las células se las encuentra en formas muy variadas: como constituyente de las membranas biológicas, como catalizadores de reacciones metabólicas (enzimas), interactuando con los ácidos nucleicos (histonas) o con neurotransmisores y hormonas (receptores), etc. ¿Qué son las proteínas? ¿Qué hacen las proteínas? ¿Qué son los aminoácidos? Clasificación de aminoácidos
  • 20. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Qué hacen las proteínas?  Algunos ejemplos de lo que las proteínas hacen:  La enizma alco ho l de hidro g e nasa transforma el alcohol proveniente de cerveza/vino/licor en una forma no tóxica que el cuerpo utiliza para comida.  La he m o g lo bina transporta oxígeno en nuestra sangre.  La fibrina forma una costra ó “cascarita” para proteger los cortes mientras curan.  La insulina regula la cantidad de azúcar en sangre y es utilizada para tratar la diabetes.  Las proteínas están presentes en todas las cosas vivas, inclusive en plantas, bacterias y virus. Algunos organismos tienen proteínas que les brindan sus características especiales:  El fo to siste m a Ies una colección de proteínas en las plantas que capturan la luz solar para poder realizar el proceso de fotosíntesis.  La lucife rasa cataliza la reacción química que hace que la luciérnaga brille.  La he m o ag lutinina ayuda al virus influe nza (de la gripe) a invadir nuestras células. ¿Qué son las proteínas? ¿Qué hacen las proteínas? ¿Qué son los aminoácidos? Clasificación de aminoácidos
  • 21. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Qué son los aminoácidos?  Son la unidad estructural básica de las proteínas.  Dos aminoácidos se combinan para forman un dipéptido. Si se une un tercer aminoácido se forma un tripéptido y así, sucesivamente, para formar un polipéptido.  Cuando las cadenas polipeptídicas superan los 40 aminoácidos se denominan proteínas.  Existen cientos de aminoácidos diferentes, pero sólo 20 son necesarios para poder formar las proteínas.  La proteína humana más grande conocida es Titina, que mide 34.350 aminoácidos. ¿Qué son las proteínas? ¿Qué hacen las proteínas? ¿Qué son los aminoácidos? Clasificación de aminoácidos  Estructura general: un carbono central unido a un grupo carboxilo (rojo en la figura), a un grupo amino (verde), a un hidrógeno (en negro) y a una cadena lateral (azul).  La diversidad de la cadena lateral caracteriza a cada aminoácido.
  • 22. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Clasificación de aminoácidos Existen muchas formas de clasificar los aminoácidos; las dos formas que se presentan a continuación son las más comunes.  Según su obtención  Esenciales: son aquellos aminoácidos que necesitan ser ingeridos por el cuerpo para obtenerlos.  No esenciales.  Según las propiedades de su cadena lateral  Neutros polares, polares o hidrófilos.  Neutros no polares, apolares o hidrófobos.  Con carga negativa, o ácidos.  Con carga positiva, o básicos.  Aromáticos. ¿Qué son las proteínas? ¿Qué hacen las proteínas? ¿Qué son los aminoácidos? Clasificación de aminoácidos
  • 23. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas  P: ¿Cómo logra la naturaleza expresar en los organismos la información contenida en el ADN? La Expresión Génica Transcripción Traducción El Código Genético Resumen Finalmente, y dicho técnicamente, llegamos al dogma central de la Biología Molecular: ¿Cómo hace una molécula de ADN para codificaruna proteína? R: A través de las Proteínas.  P: ¿Cómo se obtienen entonces las proteínas a partir del ADN? R: Con la ayuda del ARN y a través de los procesos de transcripción y traducción. Dogma Central de la Biología Molecular
  • 24. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Transcripción  Es el proceso de transferencia de información de ADN en ARNm.  Ocurre entre dos alfabetos simples: el de ADN y el de ARN.  Se realiza en el núcleo (eucariotas) o e spacio nucle ar (procariotas).  Se realiza a partir de la hebra molde de ADN (la 3’-5’).  El ARNm resultante es de cadena simple, a diferencia de la doble hélice formada por el ADN. La Expresión Génica Transcripción Traducción El Código Genético Resumen
  • 25. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas Traducción  Es el proceso mediante el cual se forman las proteínas a partir de los aminoácidos codificados por el ARNm.  Ocurre en el citoplasma (básicamente, fuera del núcleo).  Se da en 4 pasos*: 1. Activación. 2. Iniciación de la síntesis. 3. Elongación de la cadena polipeptídica. 4. Terminación de la síntesis. La Expresión Génica Transcripción Traducción El Código Genético Resumen * Analogía simple con la construcción de un edificio: 1)obtener los materiales, 2)preparar los cimientos, 3)agregar pisos, y 4)Terminar (je! :D)
  • 26. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Expresión Génica Transcripción Traducción El Código Genético Resumen Pero, si existen 20 aminoácidos diferentes, ¿cómo se identifican si sólo se tienen 4 bases distintas?  Con 1 posición, 4 bases, se podrían obtener 4 aminoácidos. (No sirve, demasiado poco…)  Con 2 posiciones, 4*4 combinaciones de bases, se podrían obtener 16 aminoácidos. (Sigue sin alcanzar)  Con 3 posiciones, 4*4*4 combinaciones de bases, se podrían obtener 64 aminoácidos. (¡Bingo!)
  • 27. El Código Genético El código genético es el conjunto de reglas por las que la información codificada en el material genético (secuencias de ADN o ARN) se traduce en proteínas (secuencias de aminoácidos) en las células vivas.  Define la relación entre secuencias de tres bases, llamadas codones, y aminoácidos.  Un codón se corresponde con un aminoácido específico.  La secuencia del material genético se compone de cuatro bases nitrogenadas distintas, que tienen una función equivalente a letras en el código genético: A, T, C y G en el ADN y A, U, C y G en el ARN.  Debido a esto, el número de codones posibles es 64.  61 de ellos codifican aminoácidos (siendo además uno de ellos el codón de inicio, AUG)  los tres restantes son sitios de parada (e stop): UAA, UAG, UGA.  La secuencia de codones determina la secuencia aminoacídica de una proteína en concreto, que tendrá una estructura y una función específicas. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Expresión Génica Transcripción Traducción El Código Genético Resumen
  • 28.  Universalidad  El código genético es compartido por todos los organismos conocidos, incluyendo virus y orgánulos (aunque pueden aparecer pequeñas diferencias).  Este hecho indica que el código genético ha tenido un origen único en todos los seres vivos conocidos.  Continuidad  Ningún codón codifica más de un aminoácido: de no ser así, conllevaría problemas considerables para la síntesis de proteínas específicas para cada gen.  No presenta solapamiento: los tripletes se hallan dispuesto de manera lineal y continua.  Su lectura se hace en un solo sentido (5' - 3'), desde el codón de iniciación hasta el codón de parada.  Degeneración  Que 61 codones codifiquen nada más que 20 aminoácidos hace del código genético que sea redundante, lo que se denomina como código degenerado. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Expresión Génica Transcripción Traducción El Código Genético Resumen El Código Genético: características
  • 29. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Expresión Génica Transcripción Traducción El Código Genético Resumen El Código Genético: tabla estándar
  • 30. Secuencia de ADN ATG Secuencia de un triplete en ADN Secuencia de ARN AUG Codón en ARNm Secuencia aminoacídica MET Aminoácido en proteína Transcripción Traducción Una analogía del Dogma llevada a la informática, más precisamente a un programa de computadora: Secuencia de ADN Código Fuente Secuencia de ARN Código precompilado Secuencia aminoacídica Ejecutable Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas La Expresión Génica Transcripción Traducción El Código Genético Resumen Resumiendo…
  • 31. ¡La estructura especifica la función de la proteína! Por ejemplo, una proteína que quiebre la glucosa de manera tal que la célula pueda utilizar la energía almacenada en el azúcar tendría una forma que reconociese a la glucosa y se le adhiriese (como llave y cerradura) y aminoácidos químicamente reactivos que reaccionen con la misma y la quiebren para liberar la energía. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Por qué es la forma tan importante? ¿Qué forma adoptará una proteína? La estructura protéica Ejemplos ¿Porqué es la forma tan importante?
  • 32.  A pesar de que las proteínas sean simplemente una cadena de aminoácidos, no les gusta mantenerse en una línea estirada.  La proteína se pliega hasta formar un globo compacto, pero mientras lo va haciendo:  deja algunos aminoácidos cerca del centro del mismo, y otros hacia fuera; y  mantiene algunos pares de aminoácidos bien cerca y otros bien separados.  Cada tipo de proteína se pliega en una muy forma específica, y es siempre la misma.  La mayoría de proteínas se pliegan por su cuenta, aunque algunas necesitan alguna ayuda extra para plegarse en la forma correcta.  La forma única de una proteína particular es el estado más Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Por qué es la forma tan importante? ¿Qué forma adoptará una proteína? La estructura proteica Ejemplos ¿Qué forma adoptará una proteína?
  • 33. La estructura de las proteínas puede jerarquizarse en una serie de niveles, interdependientes. Estos niveles corresponden a: 1. Estructura primaria, que corresponde a la secuencia de aminoácidos. 2. Estructura secundaria, que provoca la aparición de motivos estructurales. 3. Estructura terciaria, que define la estructura de las proteínas compuestas por un sólo polipéptido. 4. Estructura cuaternaria, si interviene más de un polipéptido. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Por qué es la forma tan importante? ¿Qué forma adoptará una proteína? La estructura proteica Ejemplos La estructura proteica
  • 34. Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Por qué es la forma tan importante? ¿Qué forma adoptará una proteína? La estructura proteica Ejemplos Algunos ejemplos… La he m o g lo bina es una proteína tetramérica, que sirve como un buen ejemplo de proteína con estructura cuaternaria.
  • 35. Representación de la estructura proteica a tres niveles: arriba, el primario, compuesto por los aminoácidos; en el centro, el secundario, definido por las estructuras en alfa hélice, beta lámina y semejantes; y abajo el terciario, que detalla todos los aspectos volumétricos. Dominio de unión a calcio de calm o ldulina ; las esferas azules representan al metal. Algunos ejemplos… Biología Molecular La Célula Acidos Nucleicos Proteínas Dogma Central de la Biología Molecular Plegamiento de Proteínas ¿Por qué es la forma tan importante? ¿Qué forma adoptará una proteína? La estructura proteica Ejemplos
  • 36. ElPro ble m a de lPle g ado de Pro te ínas El problemadel Plegado deProteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Definicióndel problema Motivación del enfoque computacional En la actualidad, la co nfo rm ació n de una proteína, es decir, la estructura final de la misma en el espacio tridimensional, es comúnmente estudiada a través de técnicas tales como la espectroscopia por resonancia magnética nuclear (RMN) y la cristalografía con rayos X, las cuales son costosas en términos de equipos, procesamiento y tiempo. Adicionalmente, el uso de estas técnicas requiere de procesos previos de aislamiento, purificación y cristalización de la proteína a estudiarse.
  • 37. ElPro ble m a de lPle g ado de Pro te ínas El problemadel Plegado deProteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Definicióndel problema Motivación del enfoque computacional Dada la complejidad y el costo de los factores antes mencionados la predicción automática de dicha conformación a partir de la secuencia de aminoácidos que componen la proteína es uno de los problemas mas prominentes de la bio lo g ía co m putacio nal. Sin embargo, a pesar de lo atractivo del problema, de su importancia práctica y del considerable progreso alcanzado en las técnicas utilizadas hasta el momento, el rendimiento de los mas avanzados métodos computacionales probados a la fecha sigue siendo considerado insuficie nte .
  • 38. El problemadel Plegado deProteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Definición del problema Motivacióndel enfoquecomputacional La dificultad de la resolución de este problema de predicción tiene su origen en dos factores principales, a saber: 1)El problema fundamental de, dada una estructura candidata, tener un mecanismo adecuado de medición de la calidad de dicha estructura, es decir, del nivel energético de la misma. Este pro ble m a ne ce sita se r re sue lto po r la bio q uím ica a partir de le studio y m o de lado de lo s pro ce so s re ale s de ple g ado pro te ico .
  • 39. El problemadel Plegado deProteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Definición del problema Motivacióndel enfoquecomputacional 1) El problema fundamental de, dada una estructura candidata, tener un mecanismo adecuado de medición de la calidad de dicha estructura, es decir, del nivel energético de la misma. 2) Dada dicha medición, el problema de determinar las estructuras óptimas o cercanas a la óptima para una secuencia de aminoácidos. Este pro ble m a e s una fue nte rica e inte re sante de pro ble m as co m putacio nale s para o ptim iz ació n g lo baly lo cal.
  • 40. El problemadel Plegado deProteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Definición del problema Motivacióndel enfoquecomputacional Con el fin de lograr la se paració n entre estos dos aspe cto s básico s , el problema de la optimización es frecuentemente estudiado a partir de m o de lo s sim plificado s del problema original.
  • 41. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historiadel modelo Sustento biológico Modelo HP Modelo 2D HP  Los trabajos estudiados se enfocan en el modelo Hidrofóbico-Polar en 2 dimensiones (2D HP por sus siglas en inglés), un modelo extremadamente sim ple pero e xte nsam e nte utilizado para el estudio de enfoques algorítmicos al problema de la predicción de estructura proteica.  Aún con este modelo simplificado, encontrar plegamientos óptimos es computacionalmente difícil tanto para la versión en 2 dimensiones como para su variante en 3 dimensiones (técnicamente hablando, es un problema NP-Hard tanto para el modelo original como para muchas de las variaciones del mismo. Berger & Leighton. 1998. N. Krasnogor et al. 1999).  Debido a lo anterior los métodos de optimización heurísticos se perfilan como algunos de los mas promisorios enfoques para atacar el problema.
  • 42. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historiadel modelo Sustento biológico Modelos HP y 2D HP  El m o de lo HP fue propuesto originalmente por Dill (1985) y desarrollado luego por Lau & Dill (1989) llevándolo estos a su planteamiento actual.  En el trabajo de estos últimos se incorpora el modelado de las moléculas como cadenas cortas de aminoácidos en un re tículo cuadrado de dos dimensiones (2D HP PFP).
  • 43. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HP y 2D HP  El modelo se basa en el enfoque te rm o dinám ico al problema de la predicción de la estructura terciaria de las proteínas y asume que las mismas buscan al ple g arse m inim iz ar la cantidad de e ne rg ía utilizada por el sistema llegando a un estado estable llamado e stado nativo .  Mas aún, es generalmente aceptado por la comunidad científica especializada -co n base e n lo s re sultado s e m pírico s o bte nido s- que todas las proteínas naturales tienen un estado nativo único . Esta hipótesis es conocida como la Hipó te sis Te rm o dinám ica o el Do g m a de Anfinse n.
  • 44. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HP y 2D HP  En particular, el modelo HP encuentra sustento biológico adicional en resultados bien conocidos sobre el importante rol de los aminoácidos hidrofóbicos y polares en la estructura proteica final ya que la inte racció n hidro fó bica es la fue rz a im pulso ra del plegado de proteínas y la hidro fo bicidad de los aminoácidos la principalfue rza para el desarrollo de la conformación nativa de pequeñas proteínas globulares (Richards, 1977. Lau & Dill, 1989).
  • 45. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  En el modelo HP, cada uno de los 20 aminoácidos es clasificado como Hidro fó bico (H) o Po lar (P) en base a sus características moleculares fundamentales.  Basados en esta clasificación, cada se cue ncia de am ino ácido s prim aria de una proteína (la cual puede ser representada originalmente como una cadena de caracteres de un alfabe to de 20 letras -una por cada aminoácido-) es abstraida a una secuencia de residuos hidro fó bico s o po lare s, es decir, a una cadena, de la misma longitud que la original, pero con un alfabe to re ducido a solo 2 letras (H y P, dependiendo de la clasificación del aminoácido).
  • 46. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP Eje m plo : Esta conformación en particular representa a la secuencia: HPHPPHHPHPPHPHHPPHPH. Los cuadrados ne g ro s representan aminoácidos hidrofóbicos y los blanco s simbolizan aminoácidos polares.
  • 47. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP Eje m plo : El cuadrado negro indicado como con el Núm e ro 1 corresponde al elemento s1 de la secuencia.
  • 48. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  Cabe mencionar que uno de los enfoques más comunes para la predicción de estructuras proteicas es el de modelar la e ne rg ía libre de un aminoácido dado dependiendo de su conformación y a partir de allí encontrar conformaciones de m inim ice n dicha energía.  En el modelo HP, basados en la motivación biológica antes descrita, la energía de una conformación está definida como el número de contactos to po ló g ico s entre aminoácidos hidrofóbicos que no son vecinos en la secuencia dada.
  • 49. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  En el caso de la figura, las líneas co ntinuas representan el camino seguido por la secuencia original y las líneas punte adas representan los co ntacto s H-H necesarios para el cálculo de energía según el método antes mencionado.
  • 50. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  En el caso de la figura, las líneas co ntinuas representan el camino seguido por la secuencia original y las líneas punte adas representan los co ntacto s H-H necesarios para el cálculo de energía según el método antes mencionado.
  • 51. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  En el caso de la figura, las líneas co ntinuas representan el camino seguido por la secuencia original y las líneas punte adas representan los co ntacto s H-H necesarios para el cálculo de energía según el método antes mencionado. En la conformación del ejemplo la energía tendría un valor de -9, la cual se sabe que es óptima para la secuencia utilizada
  • 52.  Dada una secuencia de aminoácidos s = s1s2s3.., encontrar una conformación de minimice la energía de s, es decir, encontrar c* tal que E(c*) = min{E(c) | c e C} , donde C(s) es el conjunto de todas las conformaciones válidas de s. El problema del Plegado de Proteínas Modelo 2DHPPFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Historia del modelo Sustento biológico Modelos HPy2DHP  Más específicamente, una conformación c con e xactam e nte de tales co ntacto s H-H tiene una energía libre )1()( −⋅= ncE n c nssss ...21= s *c { }CccEcE ∈= |)(min*)( s)(sC  El problema de 2D HP PFP puede ser de finido entonces mas formalmente de la siguiente manera:
  • 53. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  El Ant Co lo ny O ptim iz atio n (ACO por sus siglas en inglés) es un enfoque basado en poblaciones para resolver problemas de optimización combinatoria inspirado en la naturaleza exploradora de las colonias de hormigas.  El enfoque subyacente del ACO es el de un proceso iterativo en el cual una población de agentes simples (“hormigas”) construye repetidamente posibles soluciones a los problemas abordados.
  • 54. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Este proceso de construcción está probabilísticamente guiado tanto por info rm ació n he urística de la instancia dada del problema como por una m e m o ria co m partida que contiene la experiencia recolectada por las hormigas en iteraciones previas (“rastro de fe ro m o na ”).
  • 55. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  En el trabajo estudiado (A. Shmygelska et al. 2002) se analiza un algoritmo ACO para resolver el problema de Plegamiento de Proteínas usando el modelo 2D HP.  Cabe mencionar que dicho trabajo fue seleccionado como el mejor trabajo presentado durante elANTS 20 0 2: Fro m Ant Co lo nie s to ArtificialAnts 3rd Inte rnatio nalWo rksho p o n Ant Alg o rithm s – e lm ás im po rtante talle r inte rnacio nal de dicado a aplicacio ne s de ACO - re alizado e n Bruse las, Bé lg ica, e n Se ptie m bre de l20 0 2  Seguidamente se analizan mejoras posteriores (por los mismos autores en 2003 y 2005) aplicadas a dicho algoritmo y se comparan los mismos con las mejores soluciones algorítmicas conocidas en la actualidad para el mismo problema o ligeras variaciones del mismo.
  • 56. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  En el trabajo se usan instancias del problema utilizadas por implementaciones anteriores (usando otros métodos) según muestra la siguiente tabla:
  • 57. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos Las hormigas del algoritmo construyen co nfo rm acio ne s candidatas por medio del algoritmo ACO para una secuencia HP de proteínas dada y luego aplica búsq ue da lo calpara lograr mejores resultados.
  • 58. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Las co nfo rm acio ne s candidatas son representadas por medio de m o tivo s de e structura lo cal(o direcciones de plegado relativas) straig ht (S), le ft (L) y rig ht (R) los cuales indican, para cada aminoácido, su posición siguiente en el retículo 2D con relación a su predecesor directo tal como se muestra en la figura siguiente:
  • 59. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Ya que las conformaciones son invariante s co n re spe cto a las ro tacio ne s, la posición de los primeros 2 aminoácidos de la secuencia pueden ser fijados en cualesquiera dos lugares adyacentes del retículo sin pérdida de generalidad.  A partir de esta observación, se representan las conformaciones candidatas para una secuencia proteica de longitud n por una secuencia de motivos de estructura locales de longitud n-2.
  • 60. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo deHormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Por ejemplo, a la secuencia usada anteriormente (HPHPPHHPHPPHPHHPPHPH), correspondería la secuencia de motivos LSLLRRLRLLSLRRLLSL según se puede apreciar en la siguiente figura:
  • 61. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  En la fase de construcción del algoritmo, cada hormiga determina de manera aleatoria un punto de inicio dentro de la secuencia proteica.  Esto se hace eligiendo una posición de la secuencia entre 1 y n-1 de acuerdo a una distribució n ale ato ria unifo rm e y asignando arbitrariamente al correspondiente aminoácido (H o P) y a su sucesor directo dos posiciones vecinas dentro del retículo 2D.  A partir de este punto de inicio cada secuencia es plegada en ambas direcciones, añadiendo un aminoácido a la vez.
  • 62. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Las po sicio ne s re lativas hacia las cuales la conformación va extendiéndose en cada caso se determinan aleatoriamente usando una función heurística y valores de feromona (también llamados intensidad del rastro).  Estas direcciones relativas corresponden a m o tivo s e structurale s lo cale s entre triples de secuencias consecutivas de las posiciones .i-1 s si+1que representan los componentes de la solución obtenida a partir del ACO.  Conceptualmente, estos m o tivo s juegan el mismo rol que las aristas (distancias) entre ciudades en la aplicación clásica del ACO al TSP (Clásico Problema del Viajante de Comercio). 11 +− iii sss
  • 63. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Al extender una conformación de la posición i hacia la derecha colocando el aminoácido si+1en la retícula el algoritmo usa valores de feromona ti,d y valores heurísticos ni,d donde d e {S, L, R} es una dirección relativa.  Los valores heurísticos utilizados ni,d deben guiar el proceso de construcción hacia soluciones de alta calidad, esto es, hacia conformaciones con un número máximo de interacciones H-H.  En el algoritmo esto es logrado al definir ni,d basados en hi+1,, es decir, en el número de nuevos contactos H-H obtenidos al colocar si+1 en la dirección d relativa a si y si-1 cuando estamos plegando hacia ade lante (y análogamente cuando se pliega hacia atrás) i 1+is { }RLSd ,,∈ dih ,1+ is 1−is 1+is di,τ di,η di,η di,η
  • 64. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Nótese que si Si+1 = P, este aminoácido no puede contribuir a ningún nuevo contacto H-H por lo cual hi,S = hi, L = hi, R. . Más aún, para 1 < i < n- 1, hi,d <= 2 y .  En cada caso, los valores de hi,d pueden ser fácilmente determinados revisando los 7 posibles vecinos de la posible solución de si+1 en la retícula (obviamente la posición de si esta ocupada y no debe ser tomada en cuenta).  Los valores heurísticos son entonces definidos como ni ,d = hi,d , esto asegura que ni,d > 0 para todos los i y d, lo cual es importante ya que impide excluir a prio ri algún lugar de Si+ en el proceso de construcción. Psi =+1 0,,, === RiLiSi hhh 11 −<< ni 2, ≤dih3,1 ≤− dnh dih , 1+is 1,, += didi hη 0, >diη 1+is is
  • 65. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Al extender una conformación parcial sk...s i hacia si+1 durante el proceso de construcción del algoritmo ACO, la dirección relativa d de Si+1 con respecto a s i-1si esta determinada basada en la heurística y los valores de feromona de acuerdo a las siguientes probabilidades: ik ss ... 1+is 1−is1+is
  • 66. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  A partir de su punto de inicio aleatoriamente determinado l, cada hormiga primero construye una conformación parcial s..l...s1 y luego otra sl...sn.  Se probaron variantes del algoritmo en la cuales todas las hormigas iniciaban el proceso de construccion desde el mismo punto (inicio, medio y fin de la secuencia). l 1...ssl nl ss ...
  • 67. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Especialmente en el caso de secuencias largas, es frecuente encontrar conformaciones infactible s durante el proceso de construcción. Esto pasa si una conformación inco m ple ta no puede ser e xte ndida mas allá de una posición de la retícula por estar ocupados todos las posiciones vecinas de dicha posición.  El algoritmo usa dos mecanismos para solucionar este problema:.  Prim e ro , usa un sencillo mecanismo de "mirar hacia adelante" al nunca permitir que un aminoácido "interno" si (1 < i < n) sea colocado en un lugar tal que todas sus posiciones vecinas en la retícula están ocupadas (esto es barato computacionalmente ya que puede ser chequeado fácilmente durante el cálculo del valor heurístico). )1( nisi <<
  • 68. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fasedeconstrucción, feromonayvalores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Se g undo , si durante un paso de la construcción todas las posiciones de si son descartadas por el mecanismo anterior, se retrocede hasta la m itad de la distancia ya plegada y se reinicia el proceso de construcción desde la posición respectiva en la secuencia.  Es interesante notar que se probaron varias modificaciones a este mecanismo de retroceso y que se utilizó esta basados en que probó ser razonablemente rápida y efectiva. is
  • 69. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos BúsquedaLocal Actualización de feromona Resultados obtenidos  De manera similar a lo utilizado en otros algoritmos ACO conocidos, el algoritmo estudiado incorpora una fase de búsqueda local.  En esta, después de cada fase de construcción, cada hormiga aplica una búsqueda local híbrida de mejora iterativa para su conformación candidata respectiva.
  • 70. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualizacióndeferomona Resultados obtenidos  Después de cada fase de construcción y búsqueda local, hormigas seleccionadas actualizan los valores de feromona según el método estándar: Donde es la persistencia de la feromona (un parámetro que determina que tan rápido la información recolectada en iteraciones previas es “olvidada”) y .............es la calidad relativa de la solución para la conformación candidata c de la hormiga dada si tal conformación contiene un motivo de estructura local d en la secuencia en la posición i y ce ro en caso contrario.
  • 71.  Esto garantiza que la probabilidad de elegir un m o tivo de e structura lo calpara la correspondiente posición en la secuencia no se vuelva arbitrariamente pequeña. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualizacióndeferomona Resultados obtenidos  Se usa una formula de calidad relativa para cada solución dada por E(c) / E* donde E* es la energía mínima conocida para la secuencia de proteínas dada (o una aproximación basada en el numero de residuos H de la secuencia), esto para prevenir e stancam ie nto pre m aturo en la búsqueda para secuencias con valores energéticos altos.  Como un mecanismo adicional para prevenir estancamiento se usa un método de renormalización de los valores de feromona conceptualmente similar al método usado en el Sistema de Hormigas MAX-MIN (Stutzle & Hoos, 1997).
  • 72. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como mencionamos con anterioridad, el algoritmo fue probado en 9 instancias de prueba estándar, a saber:
  • 73. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como puede verse a partir de la tabla, el algoritmo encontró soluciones óptimas para todas menos para las dos secuencias más largas de las instacias de prueba utilizadas.
  • 74. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  También puede observarse la comparación efectuada entre el algoritmo con búsqueda local y só lo la búsqueda local. Se puede ver que en todos los casos fue mejor y mas rápida la combinacion de ambas cosas con lo cual se aisla el valor propio del algoritmo sin la búsqueda local.
  • 75. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Los experimentos fueron conducidos realizando un número variable de corridas para cada instancia del problema; cada corrida fue terminada cuando no fue encontrada mejora en la calidad de la solución en 10,000 ciclos del algoritmo.  Se usaron 10 hormigas para secuencias pequeñas (s <= 25) y 10- 15 para secuencias mas largas.   Se fijaron los valores de los parám e tro s básico s del algoritmo en: Co n re spe cto a lo s de talle s de la im ple m e ntació n:
  • 76. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  El procedimiento de búsqueda local fue terminado cuando no se observaba mejora a la solución después de 100-300 pasos de la búsqueda.  Se usó un método de actualización de feromona e litista en el cual solo el 20% mejor de las conformaciones obtenidas después de la fase de búsqueda local fue usada.   Adicionalmente, la mejor conformación global fue utilizada para actualizar el valor de feromona cuando no fue encontrada una mejora a la mejor solución global dentro de 20-50 ciclos. Co n re spe cto a lo s de talle s de la im ple m e ntació n:  El tiempo de ejecución fue medido en términos de tiempo de CPU y todos los experimentos fueron realizados en PCs con procesador Pentium III a 1 GHz, 256KB de cache y 1GB de RAM.
  • 77. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  El procedimiento de búsqueda local fue terminado cuando no se observaba mejora a la solución después de 100-300 pasos de la búsqueda.  Se uso un método de actualización de feromona elitista en el cual solo el 20% mejor de las conformaciones obtenidas después de la fase de búsqueda local fue usada.   Adicionalmente, la mejor conformación global fue utilizada para actualizar el valor de feromona cuando no fue encontrada una mejora a la mejor solución global dentro de 20-50 ciclos. Co n re spe cto a lo s de talle s de la im ple m e ntació n:
  • 78. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como puede verse a partir de la tabla, el algoritmo encontró soluciones óptimas para todas menos para las dos secuencias más largas de las instancias de prueba utilizadas.
  • 79. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Una gráfica de mediciones de run-time distributions (RTD) fue utilizada basada en los trabajos que en esta metodología hicieron Hoos y Stutzle (2000) para aquellas secuencias en las que se obtuvo el valor óptimo más de una vez. Los resultados se pueden apreciar en la siguiente grafica:
  • 80. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  En la gráfica puede observarse evidencia de e stancam ie nto en las secuencias mas largas; en el trabajo se sugiere que en estos casos una mejor heurística y/o una mejor búsqueda local podrían mejorar los resultados obtenidos.
  • 81. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Buscando evaluar el beneficio de usar una po blació n de ho rm ig as en lugar de una sola hormiga se estudió el im pacto de variar el número de hormigas para el algoritmo. Si bien usando una sola hormiga se obtuvieron buenos resultados para instancias pequeñas (n <= 25) la mejor solución al problema 4 (n=36) no pudo ser encontrado después de una corrida de 2 horas de CPU.
  • 82. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como en otros casos donde ha sido utilizado el algoritmo, en esta caso también la estrategia de actualización de feromona basada en un criterio elitista también parece aplicar a este problema: Se probaron 3 tipos de actualizaciones diferentes: 1) Todas las hormigas. 2) Todas las hormigas con refuerzo para el 20% mejor de las hormigas. 3) Solo el 20% mejor de las hormigas.
  • 83. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Los resultados obtenidos pueden ser apreciados en la siguiente gráfica:
  • 84. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como puede verse, los mejores resultados fueron obtenidos a partir de las estrategias donde se actualizaba a partir de los resultados (únicos o reforzados) del mejor 20% de las hormigas.
  • 85. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Esto sugiere que la intensificación en la búsqueda provista por la estrategia antes mencionada se requiere para alcanzar un buen rendimiento en el algoritmo ACO utilizado.  Al mismo tiempo, experimentos adicionales no reportados en el trabajo pero mencionados en el, indican que el mecanimo de renormalizacion de feromona es crucial para resolver instancias grandes del problema, lo cual subraya la importancia de la diversificación de la búsqueda (escape de mínimos locales).
  • 86. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  El siguiente análisis estudio la importancia relativa de la heurística contra la de la feromona. Los resultados se muestran en la siguiente grafica:
  • 87. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Como puede apreciarse, en principio ambos valores probaron ser importantes en los resultados obtenidos.
  • 88. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Es interesante observar que eliminar la influencia de la feromona es más perjudicial que eliminar la influencia de la heurística aún para casos pequeños. Este fenómeno se hace más pronunciado a medida que se intentan resolver instancias mayores del problema.
  • 89. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  Finalmente, se estudiaron el efecto del punto de inicio en la construcción de las conformaciones en el rendimiento final del algoritmo.  Con tal fin, se probaron 4 e strate g ias para determinar la posición inicial desde el cual iniciar las conformaciones en la etapa de construcción del algoritmo: 1) Todas las hormigas pliegan hacia ade lante iniciando en la posición 1. 2) Todas las hormigas pliegan hacia atrás iniciando en la posición n 3) Todas las hormigas pliegan hacia ade lante y hacia atrás iniciando en la mitad de la secuencia 4) Todas las hormigas pliegan hacia ade lante y hacia atrás iniciando en posiciones aleatoriamente determinadas de la secuencia.
  • 90. El problema del Plegado de Proteínas Modelo 2D HP PFP ACOaplicado a2DHPPFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algoritmo de Hormigas Fase de construcción, feromona y valores heurísticos Búsqueda Local Actualización de feromona Resultados obtenidos  La cuarta estrategia, es decir, la de que cada hormiga iniciara en una posición de la secuencia elegida aleatoriamente y de allí plegara en un sentido y luego en el otro, mostró ser con mejor que las demás. Esta diferencia es aún mayor en secuencias mas largas y sugiere que la diversificación de la búsqueda aportada por múltiples y diversos puntos de inicio es importante para lograr un buen rendimiento.
  • 91. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas alACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Trabajos posteriores ACO 2003 y 2005  Como una de las conclusiones del trabajo presentado (2002) se menciona que si bien no se pudieron mejorar los logros de los m e jo re s alg o ritm o s co no cido s para las instancias del problema estudiadas, los resultados eran muy alentadores y la implementación dejaba sin lugar a dudas enseñanzas valiosas que podrían aprovecharse en trabajos futuros.  Estos resultados no tardaron en llegar ya que el mismo grupo de investigación (liderado por Shmygelska y Hoos) siguieron trabajando en mejoras sucesivas al algoritmo con resultados muy interesantes.  En particular se presentaron trabajos en el 2003 y el 2005, siendo los resultados de este último casi tan buenos como los mejores algoritmos conocidos hasta el momento.
  • 92. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas alACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Trabajos posteriores ACO2003y2005  Algunas de las mejoras que se fueron incorporando al algoritmo original incluyen: • Método de búsqueda local (2003 y 2005) • Estrategia para avanzar en el plegado hacia adelante o hacia atrás (2003) • Ho rm ig as de m e jo ra aplicadas no solo al mecanismo global sino también a las mejoras locales (2003) • Mucho mayor cantidad de hormigas (2003, 2005) • Se incorporan soluciones de muy alto rendimiento al problema en su versión 3D (2005) • Definición de la fórmula heurística basada ahora en la distribución de Boltzman (2005)
  • 93. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Otros Algoritmos  Existe una gran cantidad de trabajos para resolver el 2D HP PFP con un enfoque computacional.  Entre estos se incluyen: Enfoques desde los algoritmos geneticos, variantes y enfoques clásicos del método de Monte Carlo (siendo uno de estos, el llamado PERM –Prune Enrichement Rosenbluth Method, acaso la solución computacionalmente más exitosa entre las que se conocen) Algoritmos con Tabu Seach, Simulated Annealing, etc. además de varios métodos de solución específicos al problema.  Es importante notar que el problema ha sido además extensamente atacado en años recientes por lo cual es dificil entender en cada momento cual es la mejor implementación de todas aún para las instancias más comunes del problema.
  • 94. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Otros Algoritmos  De una novedosa implementación reciente (Filter-and-Fan approach. Rego et al. 2006) obtuvimos una tabla más o menos reciente con los mejores algoritmos en ese momento:
  • 95. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática Algunas aplicaciones biológicas Algunas aplicaciones biológicas La era de las “OMICs” de la Biología Molecular Acoplamiento proteína-proteína Anotación de genomas Análisis de imagen de alto rendimiento Biología evolutiva computacional Análisis de la expresión de proteínas Genómica comparativa Análisis de la expresión génica Medición de la biodiversidad Análisis de la regulación Modelado de sistemas biológicos Análisis de mutaciones en el cáncer Predicción de la estructura de las proteínas Análisis de secuenciasHoy en día, son cada vez más los congresos, tales como el MAEB (Co ng re so so bre Me tahe urísticas, Alg o ritm o s Evo lutivo s y Bio inspirado s ), que tienen como principal objetivo reflejar el estado del arte respecto al uso de las técnicas metaheurísticas y bioinspiradas en aplicaciones biológicas y/o biomédicas.
  • 96. El problema del Plegado de Proteínas Modelo 2D HP PFP ACO aplicado a 2D HP PFP Mejoras sucesivas al ACO Otros algoritmos aplicados Otros Problemas de la Bioinformática La era de las “OMICs” de la Biología Molecular  Genómica (Genomics): estudio de los genomas de los organismos (secuenciación, mapeo e interacciones génicas).  Proteómica (Proteomics): estudio de todo el complemento proteico en un sistema u organismo.  Transcriptómica (Transcriptomics): todos los ARN mensajeros (ARNm) o "transcriptos", producidos por una célula o un conjunto de células.  Metabolómica (Metabolomics): mapa completo de todos los metabolitos moleculares pequeños en el cuerpo humano (metaboloma humano)  Genómica Estructural (Structural Genomics): determinación de la estructura 1D, 2D y 3D de todas las proteínas en un organismo dado.  Informática (Informatics): aplicación de tecnología de la información al campo de la Biología Molecular.  Farmacogenómica (Pharmacogenomics): identifica las bases genéticas para la herencia y variación interindividual en respuesta a drogas. Algunas aplicaciones biológicas La era de las “OMICs” de la Biología Molecular