Presentación dada en la clase BIOL-3705 (Genética de Bacterias) en el auditorio de enfermería (E-105) para Diciembre de2011. La profesora encargada era Cynthia Cardona.
1. Proteómica y Bioinformática.
.
Elmarie Sanchez Gonzalez Dilean Toledo Cabrera
Kipsain Rosario Ortiz Paola A. Sandoval Perez
Stephanie M. Romero Rosa Michelle M. Torres Santos
Ingrid M. Suarez Ramirez Denisse Torrech Ribot
BIOL-3705-M10
Prof. Cynthia Cardona
3. Proteómica: Historia
• Marc R. Wilkins es un científico australiano que
se acredita con el concepto del proteoma
• Profesor en la Escuela de biotecnología y
ciencias biomoleculares en la Universidad de
New South Wales, Sydney, Australia.
• Acuñó el término proteoma en 1994, , mientras
que el desarrollo del concepto como estudiante
de doctorado
• Concepto de que el genoma abarca el conjunto
de todas las proteínas que pueden ser
producidas a través del genoma, de splicing
alternativo y post-transcripcional modificación
del ARN mensajero.
4. Proteómica: Recordando
• La síntesis de todas las proteínas celulares está
codificada por los genomas. En la actualidad, tenemos
disponible más de 150 genomas celulares, incluyendo
varios organismos multicelulares.
5. Proteómica
• La proteómica es la nueva etapa en la investigación
biológica que sale naturalmente de la genómica.
• La proteómica es el estudio y caracterización de todo
el conjunto de proteínas expresadas de un genoma
(proteoma).
6. Proteómica
• La proteómica es una ciencia relativamente
reciente.
• Identificación de nuevos marcadores para el:
Análisis de
procesos de Diagnóstico de
transducción de enfermedades
señales
Determinación Identificación de
proteínas nuevos fármacos
7. Métodos de análisis proteínas
• La espectrometría de masa y la electroforesis son
las técnicas más utilizadas en la proteómica para
tres diferentes propósitos:
– Analizar globalmente el proteoma y separar sus
proteínas.
• Métodos: 2DE, DIGE, ICAT y MudPIT
– Analizar individualmente las proteínas
• Métodos: espectrometrías de masa:
MALDI-TOF y SELDI-TOF-MS
– Estudiar interacciones entre proteínas
• Métodos: “yeast two hybrids” de alto
rendimiento o/y la técnica “Phage Display”.
.
8. El ICAT
Marcaje Isotópico Diferencial
• Método donde no es necesaria la 2DE.
• Se derivan químicamente los péptidos con el
reactivo ICAT, lo que hace que uno de los extremos
reaccione con cisteína y el otro con biotina.
– Los que reaccionan con cisteínas son aislados
selectivamente mediante un proceso de cromatografía
de afinidad.
• Además de esto el ICAT tiene la capacidad de ser un
reactivo ligero y a la vez pesado, lo que ayuda a la
cuantificación de diferencias entre las proteínas
expresadas .
9. DIGE
• Es similar al 2DE, pero en
este solo se usan proteínas
de 3 muestras diferentes
las cuales se marcan con
fluoruros distintos, se
mezclan y se colocan en un
mismo gel.
• Lo que permite cuantificar
las variaciones en niveles
de expresión de proteínas
entre varias muestras.
10. MudPIT
Tecnología de Identificación de Proteínas Multidimensional
• Más eficiente para identificar mezclas
complejas de péptidos y funciona para
identificar proteínas hidrofóbicas.
• Porque con sales volátiles pueden
eluir péptidos en intercambio
catiónico y luego se separan
utilizando el sistema RP-HPLC junto
con un (MS).
11. Electroforesis Bidimencional (2DE)
• Técnica para análisis de grandes
cantidades de proteínas al mismo
tiempo.
• La investigación en este campo comenzó
más de 50 años atrás, continuó en 1956
con el invento del gel en 2 dimensiones
por Simithies y Poulick, y convertido por
O’Farrell a lo que se conoce hoy en día
como: 2DE.
12. Electroforesis Bidimencional (2DE)
• Las proteínas, “spots”, sometidas a éste
procedimiento viajan a través de la
membrana por un gradiente de pH hasta
alcanzar su punto isoeléctrico y se van
separando unas de otras por su tamaño
molecular en presencia del (SDS).
13. Espectrometria de masa (MS)
• Es una tecnica que mide la masa de
las moléculas con gran precisión.
• Los espectrómetros de masa tienen
dos partes:
- Fuente de iones
- Aparato medidor
14. Espectrometría de Masa
Cooke & Hill: Genetics of susceptibility to human infectious diseases
Nature Reviews Genetics 2001;2:967-977 (www)
15. MALDI o ESI-MS
Matrix assisted Laser Desorption/ Ionization-Mass spectrometry
A comienzos de los años 70, el láser
comenzó a utilizarse en espectrometría de
masas para analizar la desorción de iones
se encontraron con espectros poco intensos
que contenían fragmentos de las moléculas
analizadas.
16. MALDI o ESI-MS
Matrix assisted Laser Desorption/ Ionization-Mass spectrometry
1. La muestra se mezcla con la matriz en
exceso sobre una superficie de meta
2. Esta preparación es sometida a pulsos
cortos de láser en alto vacío
3. El área irradiada, se calienta
18. MALDI- TOF-MS
Matrix Assisted Laser Desorption Ionization- Time Of Flight
Mass Spectrometry
Esta técnica es un analizador de tiempo de vuelo.
La determinación de la masa en una región de alto
vacío se realiza mediante una medida muy precisa
del período de tiempo desde la aceleración de los
iones en la fuente (“source”) hasta que impactan
con el detector
21. Bioinformática: Conceptos y Alcance
• La investigación, desarrollo o aplicación de
herramientas computacionales y aproximaciones para
la expansión del uso
de datos biológicos, médicos, conductuales o de
salud, incluyendo aquellas herramientas que sirvan
para adquirir, almacenar, organizar, analizar o visuali
zar tales datos.
22. Bioinformática: Historia
• Años 50:
• Se propone la estructura de doble hélice del ADN
• Se secuencia la primera proteína (insulina bovina)
• se construye el primer circuito integrado.
• Años 60 y 70:
• Teoría sobre evolución molecular
• Atlas of Protein Sequences
Jack Kilby
23. Principales Áreas de Investigación
• Anotación de Genomas
• Análisis de Expresión Genética
• Análisis de Expresión de
Proteínas
• Mutaciones del Cáncer
• Análisis de Secuencias
• Biología Evolutiva Computacional
• Medición de la Biodiversidad
• Predicción de la Estructura de las
Proteínas
• Genómica Comparativa
24. Anotación de Genomas
• La inserción de información de
manera confiable y actualizada
para describir una secuencia.
• Información
• Interpretación
• Dos niveles de Anotación
• Estructural
• Funcional
• ¿De donde se consigue esta
información?
25. Análisis de la Expresión Genética:
• Es el proceso mediante el cual
todos los organismos
transforman la información
codificada de los ácidos
nucleicos en las proteínas
necesarias para su desarrollo
y funcionamiento.
• Creación de herramientas
estadísticas para separar la
señal del ruido en los estudios
de expresión génica con alto
volumen de procesamiento.
26. Análisis de la Expresión Genética:
• Existen múltiples técnicas propensas al ruido para
determinar la expresión génica de muchos genes por la
medición de niveles de mRNA . Como ejemplo de ellas
podemos ver:
Microrrays de ADN Secuenciacion de EST
Análisis en serie de la
MPPS
expresión genética
Diversas aplicaciones de
hibridación in situ
27. Análisis de la expresión de proteínas
• Análisis de la expresión de proteínas:
• Para saber las proteínas presentes en una muestra
biológica se pueden utilizar dos procedimientos
muy soportados por la bioinformática:
Procedimiento Problemas
Sus niveles de expresión tienen un alto nivel
Microrrays de proteínas de variabilidad de experimento a experimento.
El casar grandes cantidades de datos de
masas contra masas predichas.
Espectrometría de masas El complicado análisis estadístico de muestra
donde se detecta múltiples incompletos
péptidos de cada proteína.
28. Mutaciones del cáncer
• En el cáncer los genomas de
las células afectadas se
reordenan en maneras
complejas.
• Constantemente se realizan
esfuerzos para identificar
sustituciones de bases
desconocidas en una variedad
de genes en el cáncer.
29. Mutaciones del cáncer
• Existen varios métodos de detección física que miden miles
de posiciones a lo largo del genoma los cuales ayudan a
proporcionar nuevas oportunidades para los
bioinformáticos:
– Microrrays de oligonucleótidos
– Arrays de polimorfismo de nucleótido simple
• Los bioinformáticos continúan produciendo sistemas
automatizados para así poder saber el importante volumen
de datos de secuencias.
30. Análisis de Secuencias
• Desde que el fago Φ-X174 fue secuenciado, las secuencias de ADN de
cientos de organismos han sido decodificados y guardados en bases de
datos.
• Estos datos son analizados para determinar los genes que codifican
para ciertas proteínas, así como también secuencias reguladoras. Una
comparación de genes en una especie puede mostrar similitudes entre
funciones de proteínas, o relaciones entre especies.
• Con la creciente cantidad de datos que han obtenido desde hace mucho
tiempo atrás, se ha vuelto poco practico el análisis de las secuencias de
ADN manualmente.
• Hoy día se utilizan programas computarizados para el estudio del
genoma de los organismos, conteniendo miles de millones de
nucleótidos.
31. Análisis de Secuencias
• Con estos programas podemos compensar las mutaciones en la
secuencia de ADN, o sea las que están relacionadas pero que no son
idénticas.
• Una variante de este alineamiento se secuencias se usa en el proceso de
secuenciación. Este proceso es conocido como "shotgun", no da una lista
secuencial de nucleótidos pero en cambio nos ofrece las secuencias de
miles fragmentos pequeños de ADN.
• El shotgun nos brinda datos de secuencia rápidamente, pero se encarga
principalmente de ensamblar los fragmentos. El “shotgun sequencing”
es el método de elección para todos los genomas secuenciados hoy en
día y los algoritmos de ensamblado genómico son un área crítica de la
investigación en bioinformática.
32. Análisis de Secuencias
• Otro aspecto de la bioinformática en análisis de secuencias es la
búsqueda automática de genes y secuencias reguladoras dentro
de un genoma.
• No todos los nucleótidos dentro de un genoma son genes. Dentro
del genoma de organismos más avanzados, grandes partes del
ADN no sirven.
• Este ADN, conocido como "ADN basura", puede, sin
embargo, contener elementos funcionales todavía no
reconocidos.
• La bioinformática sirve para estrechar la brecha entre los
proyectos de genoma y proteoma. (por ejemplo, en el uso de
secuencias de ADN para identificación de proteínas).
33. Biología Evolutiva Computacional
• La Biología evolutiva es el estudio del origen ancestral de las
especies, así como de su cambio a través del tiempo. Ha permitido a los
investigadores:
• Seguir la evolución de un alto número de organismos midiendo
cambios en su ADN, en lugar de hacerlo exclusivamente mediante su
taxonomía física u observaciones fisiológicas.
• Más recientemente, comparar genomas completos, lo que permite el
estudio de eventos evolutivos más complejos, tales como la
duplicación de genes, la transferencia horizontal de genes, o la
predicción de factores significativos en la especiación bacteriana.
• Construir modelos computacionales complejos de poblaciones para
predecir el resultado del sistema a través del tiempo.
• Seguir y compartir información sobre un amplio y creciente número
de especies y organismos.
34. Medición de la Biodiversidad
• La biodiversidad de un ecosistema puede definirse como el conjunto
genómico completo de todas las especies presentes en un medio
ambiente particular, sea este una biopelícula en una mina
abandonada, una gota de agua de mar, un puñado de tierra, o la
biosfera completa del planeta Tierra. Se utilizan bases de datos para
recoger los nombres de las especies, así como de sus
descripciones, distribuciones, información genética, estado y tamaños
de las poblaciones, necesidades de su hábitat, y cómo cada organismo
interactúa con otras especies.
• Un potencial muy excitante en este campo es la posibilidad de
preservar las secuencias completas del ADN, o genomas, de especies
amenazadas de extinción, permitiendo registrar los resultados de la
experimentación genética de la Naturaleza in silico para su posible
reutilización futura.
35. Predicción de la Estructura de las
Proteínas
• Predicción de la estructura tridimensional de una
proteína desde su secuencia de aminoácidos.
• Uno de los principales objetivos de la
bioinformática y de la química teórica, al igual que
es altamente importante en la medicina y la
biotecnología.
• Estrategias básicas para aproximarse a predecir
una estructura:
– Predicción de novo
– Predicción por comparación
36. Predicción de una estructura
secundaria
• Métodos para la predicción de una estructura
secundaria:
– Algoritmo DSSP
– Método de Chou-Fasman – preciso
aproximadamente en un 50-60%
– Método GOR - preciso aproximadamente en
65%
38. Genómica comparativa
• Estudia las semejanzas y
diferencias entre genomas
(proteínas, ARN y regiones
reguladoras) de diferentes
organismos para deducir
como la selección natural ha
actuado sobre estos
elementos.
• Beneficia al ser humano para
entender la función y
evolución molecular sintética
como en la cromosómica que
surge en los genomas.
39. Aportes de la genómica
comparativa
• Mayor entendimiento de:
– Diversidad microbiana
– Estructura de operones y regulación génica
– Elementos genómicos móviles y
transferencia horizontal de genes
– Interacción de organismos patógenos y
hospedero
40. Conclusión
• A modo de síntesis, la proteómica como estudio de
proteomas, así como la genómica, configura una
disciplina fundamental que trata de descubrir la
constelación de proteínas que otorgan a las células
su estructura y función. Por otro lado gracias a la
bioinformática, la cual a través de herramientas y
utilizando la información ya depositada en bases de
datos alrededor del mundo estamos comenzando a
descubrir relaciones no triviales escondidas en el
código de la vida.
Notas del editor
Las tecnicas mas utilizadas
Estosimplifica en grupos los peptidoscontenidos en mezclascomplejas a proteinas mas pequenas
DIGE es similar a una 2DE, pero solo se usanproteinas de 3 muestrasdiferenteslascuales se marcan con fluorurosdistintos, se mezclan y se colocan en un mismo gel. Lo quepermitecuantificarlasvariaciones en niveles de expresion de proteinas entre variasmuestras.
Se utilizan sales volatiles queeluyen los peptidos en la matriz de intercambiocationico lo que se acopla al sistema RP_HPLC
Isoelectrico=carece de carga…….detergenteanionicomuypotente (docecilsulfato de sodio) SDS PAGELas proteinas con carganegViajanhaciacarga + el anodo. Mientra mas + los poro de la matriz del gel son mas peq.Pasos:Se elimina lo que no esproteina de la muestraseparacionporpuntoisolectrico [no hay carga]separacionportamaño Scan de spots “deteccion” se analizanesasimagenes para identificar los cambios en la expresion de proteinasbajodiferentescondiciones se realizandiferentesestudiosdependiendo del interes y se comparan con la base de datos