Biología Estructural PEC3

Máster Universitario en
Bioinformática y Bioestadı́stica
Biologı́a Estructural
Prueba de Evaluación Continua 3
14 de diciembre de 2021
Igor Garcı́a Atutxa

Índice
1. Preguntas iniciales 2
2. Enunciado 4
2.1. Ejercicio 1: Predicción de estructura por homologı́a . . . . . . . . . 4
2.2. Ejercicio 2: Predicción de estructura por reconocimiento de plegado
o threading . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3. Ejercicio 3: Predicción de estructura ab initio . . . . . . . . . . . . 12
1

Biologı́a Estructural Igor Garcı́a Atutxa
1. Preguntas iniciales
1. ¿Qué problemas presenta la cristalografı́a de rayos X?
El mayor problema es la generación de cristales de proteı́nas perfectamente
ordenados sobre los que se pueda aplicar la técnica, que difracte los rayos X
obteniendo una señal óptima.
2. ¿En que dos circunstancias se suele emplear RMN por encima de
cristalografı́a de rayos X?
Cuando nos encontramos con biomoléculas no cristalizables o para estudiar
moléculas en disolución o en contacto con otras.
3. ¿Qué condiciones tienen que cumplir las proteı́nas para poder
determinar su estructura por RMN?
Las biomoléculas deben de ser solubles y tienen una limitación de tamaño
(record actual 800 aminoácidos).
4. ¿Qué tipo de alineamiento refleja con mas fiabilidad las secuencias
con una relación evolutiva lejana?
Alineamiento múltiple de secuencias.
5. ¿Qué diferencias hay entre secuencias ortólogas y parálogas?
Las secuencias ortólogas son aquellas cuya similitud deriva de una ascenden-
cia común. En cambio, son parálogas cuando la similitud entre secuencias se
produce dentro del mismo genoma.
6. ¿En que nos basamos para modelar los giros?
En el número de aminoácidos que tienen y en las estructuras secundarias que
conectan.
7. ¿Qué condición se debe cumplir para obtener un buen modelo por
homologı́a?
Cuando se conoce que la estructura que se busca es parecida a otra que ya
se ha determinado experimentalmente.
8. ¿Qué es y en que se basa el reconocimiento de plegado?
El reconocimiento de plegado pretende encontrar la conformación que adop-
tarán los aminoácidos de una secuencia, mediante herramientas informáticas.
Esta técnica se basa en el procesamiento de secuencias polipeptı́dicas y las
relaciona con varias conformaciones conocidas hasta que los algoritmos de
computación determinan cuál de las conformaciones proporciona la energı́a
de estabilidad óptima para el polipéptido.
9. ¿Se puede determinar completamente la estructura secundaria de
una proteı́na a partir de la secuencia?
Completamente no. Se pueden hacer predicciones que son acertadas en el
60 % o 70 % de los casos.
10. ¿Es adecuado utilizar el modelado ab initio para diseño de
fármacos? Razonad la respuesta.
2

Sı́, muy adecuado. El diseño de fármacos asistido por computadoras es una
de las herramientas mas eficaces actualmente.
En el diseño de estos fármacos se parte del diseño de la molécula. Se introduce
la nueva molécula en el software, dándonos información sobre esta (estado
mı́nima energı́a, estabilidad, isómeros...). Esa molécula que se esta diseñando
se puede introducir en una base de datos y contrastarla con otras ya existentes
de estructura similar. Por contraste con estas últimas, se podrı́a predecir que
funcionalidades deberı́a tener la nueva molécula.
3

2. Enunciado
2.1. Ejercicio 1: Predicción de estructura por homologı́a
Alineamiento de las dos secuencias mediante el programa EMBOSS NEEDLE.
Figura 1: Captura del alineamiento de las dos secuencias.
Explorad el alineamiento y decidid a partir de éste si son dos
proteı́nas más o menos parecidas. Explicad por qué a partir de
los sı́mbolos del alineamiento.
Son parecidos, tienen un número pequeño de gaps y su número de
coincidencias (identidad) es superior a una cuarta parte, alcanzado casi un
50 % en la similitud fisicoquı́mica entre aminoácidos.
Alineamiento utilizando ahora el programa SWISS MODEL
4

Figura 2: Alineamiento de las dos secuencias con el programa SWISS MODEL.
Verificamos que el alineamiento es correcto y construimos el modelo, obtenemos
la siguiente imagen:
Figura 3: Captura del alineamiento de las dos secuencias.
Enumerad las partes más importantes de la salida del programa,
los gráficos, etc. y qué significan.
En la gráfica se muestra el template, la identidad de la secuencia, el GMQE
y QMEANDisCo que valoran el modelo.
Analizad los resultados que habéis obtenido: la calidad del
alineamiento de secuencias, de las estructuras secundarias y todos
los parámetros que evalúan la calidad del modelo.
GMQE = 0.57 y QMEANDisCo = 0.63 ± 0.08
En base a todo lo anterior, ¿es un buen modelo?
Sı́, ya que lo explica en un 60 %.
Podemos visualizar las proteı́nas en nuestro ordenador usando diferentes
programas. En nuestro caso utilizaremos RASMOL.
Plasmad el dibujo realizado por vosotros con RASMOL en vuestra
PEC y comparad visualmente ambas proteı́nas (el modelo y la
experimental).
5

Figura 4: Dibujo del modelo utilizando la herramienta RASMOL (Mostrar =
cintas, Colores= estructura).
Figura 5: Dibujo de la proteı́na experimental utilizando la herramienta RASMOL
(Mostrar = cintas, Colores= estructura).
¿Detectáis alguna diferencia?
6

¿En qué regiones está mejor resuelto nuestro modelo? ¿Por qué?
¿Pensáis que vuestro modelo es aceptable? ¿Se podrı́a mejorar?
¿Se os ocurre alguna manera de hacerlo?
Explicad la/s estrategia/s que utilizarı́ais a partir de lo que se
explica en los materiales de la asignatura.
Ahora utilizaremos el método automático para buscar secuencias parecidas en
SWISS MODEL.
En este caso solo pondremos la secuencia de tioredoxina para E.coli y
el programa busca los mejores templates para modelar nuestra secuencia.
Seleccionamos Search for templates.
¿Qué 5 templates de PDB salen en las primeras posiciones?
Figura 6: Primeras 5 posiciones de templates utilizando la funcionalidad search
for templates de SWISS MODEL para tioredoxina E.coli.
¿Qué identidad de secuencia tienen respecto a la secuencia de
E.coli?
90 % las cuatro primeras y 89 % la quinta.
¿A qué especies pertenecen?
7

Ahora seleccionamos Build Models con, por ejemplo, el primer template.
Plasmad el output del programa en vuestra PEC y analizad todos
los parámetros que evalúan el modelo resultante.
Figura 7: Primeras 5 posiciones de templates utilizando la funcionalidad search
for templates de SWISS MODEL para tioredoxina E.coli.
A partir de estos, decidid si el modelo ha mejorado respecto al
primero que hemos obtenido. Razonad la respuesta.
8

2.2. Ejercicio 2: Predicción de estructura por reconoci-
miento de plegado o threading
Para esta predicción utilizaremos el programa PHYRE para la proteı́na de
transporte del molibdeno delorganismo E.coli.
Mientras esperáis los resultados leed el siguiente texto y describid
en pocas palabras qué hace el programa y qué resultados se
obtienen (es recomendable también releer los materiales de la
asignatura para recordar en qué consiste el threading):
Este sistema está diseñado en torno a la idea de predecir la estructura
tridimensional que tiene una secuencia de proteı́na o gen. Utiliza la alineación
de modelos ocultos de Markov para mejorar significativamente la precisión
de la alineación y tasa de detección. Phyre2 también incorpora una nueva
simulación de plegado llamado para modelar regiones de proteı́nas sin
homologı́a detectable con estructuras conocidas.
Plasmad en vuestra PEC el output del programa.
Figura 8: Output programa PHYRE2.
¿Qué PDBs se encuentran en las primeras seis posiciones?
3D31, 2ONK y 2R6G.
¿Cuál es la confianza de los seis primeros hits? ¿Qué significa este
parámetro?
100 %. La probabilidad de que la secuencia y el template sean homólogos.
¿Qué identidad de secuencia tienen estos hits respecto a la
secuencia problema?
33 %, 33 %, 31 %, 31 %, 23 % y 21 %, respectivamente.
9

Plasmad en el papel el dibujo del mejor modelo obtenido para esta
proteı́na.
Figura 9: Mejor modelo obtenido.
¿A partir de qué proteı́na se ha obtenido?
ATP-binding protein.
¿A qué organismo pertenece?
Methanosarcina acetivorans C2A.
Ahora escogemos el primer hit. ¿En qué función (según PDB) está
implicada esta proteı́na? ¿Y los siguientes hits?
Primer hit hydrolase/transport protein, segundo hit transport protein, tercer
hit protein binding, cuarto hit protein binding, quinto hit ABC-type maltose
transporter activity, sexto hit ABC-type maltose transporter activity.
Buscad a qué fold, superfamilia y familia pertenece según SCOP
el primer hit.
Fold = ABC domain-like, superfamily = ABC transporter-like P-loop
ATPases y family= ABC transporter ATPase domain-like
Ahora mirad en UNIPROT nuestra secuencia problema y observad
en qué proceso biológico está implicada.
10

¿Qué tipo de relación existe entre la secuencia problema y los dos
primeros hits?¿Tienen el mismo fold?
¿Existe relación funcional entre los modelos obtenidos y la
secuencia incógnita?
¿Podrı́ais utilizar el método de modelado por homologı́a del
ejercicio 1 teniendo en cuenta la identidad de secuencia de todos
los hits obtenidos? ¿Por qué?(consultad la sección de los materiales
de la asignatura que trata sobre el modelado por homologı́a).
Podéis calcular la calidad del modelo con Run investigator para el
primer modelo. En base a los parámetros obtenidos:
¿Creéis que el modelo es bueno? Razonad la respuesta.
¿Por qué razón hemos obtenido un buen modelo a pesar de tener
baja identidad de secuencia?
11

2.3. Ejercicio 3: Predicción de estructura ab initio
Ahora construiremos un modelo a partir solo de la secuencia de una proteı́na,
sin conocimiento previo de plegados conocidos (threading) ni tampoco de estruc-
turas de proteı́nas con secuencia parecida (modelado por homologı́a). Esto se hará
con el programa PEP-FOLD y utilizaremos el modelo de la insulina Bos taurus.
Comparamos visualmente con RASMOL la estructura cristalográfica experi-
mental 6Q8Q de Bos taurus (recordad que la cadena de la insulina es la B, ası́
que pondréis el comando restrict *B) con el modelo obtenido. Poned las capturas
de pantalla en la PEC.
Figura 10: Visualización mediante RASMOL de las estructura experimental
6Q8Q.
12

Figura 11: Visualización mediante PEP-FOLD del modelo de la insulina Bos
taurus.
A partir de las estructuras: ¿Qué diferencias observáis a nivel
estructural?¿Creéis que habéis obtenido un buen modelo?
¿Creéis que este modelo es mejor que un modelo por homologı́a?
¿Por qué?
¿Qué se os ocurrirı́a para mejorarlo?
13

Biología Estructural PEC3

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (9)

Similar a Biología Estructural PEC3

Similar a Biología Estructural PEC3 (20)

Más de Igor García Atutxa

Más de Igor García Atutxa (11)

Último

Último (20)

Biología Estructural PEC3