Proteins are polymers of amino acids existing as a structural and functional unit. here we look at various bioinformatics tools that can be used to predict these protein structures from its known amino acid sequence.
Proteins are polymers of amino acids existing as a structural and functional unit. here we look at various bioinformatics tools that can be used to predict these protein structures from its known amino acid sequence.
El objetivo del software MEGA ha sido proporcionar herramientas para explorar, descubrir y analizar secuencias de ADN y proteínas desde una perspectiva evolutiva.
Alineamiento de secuencias de adn, árbol fitogenéticoBrayan Chipana
Un alineamiento de secuencias en bioinformática es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.
Se efectuó el alineamiento y la filogenia de treinta secuencias del GEN 16s rRNA mediante la aplicación de software libre MEGA: Análisis de Genética Evolutiva Molecular la cual permitió mostrar la historia evolutiva generando un árbol optimo con 30 secuencias de nucleótidos.
El objetivo del software MEGA ha sido proporcionar herramientas para explorar, descubrir y analizar secuencias de ADN y proteínas desde una perspectiva evolutiva.
Alineamiento de secuencias de adn, árbol fitogenéticoBrayan Chipana
Un alineamiento de secuencias en bioinformática es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.
Se efectuó el alineamiento y la filogenia de treinta secuencias del GEN 16s rRNA mediante la aplicación de software libre MEGA: Análisis de Genética Evolutiva Molecular la cual permitió mostrar la historia evolutiva generando un árbol optimo con 30 secuencias de nucleótidos.
Trabajo Fin de Master Modelizacion, Estadistica y Computación. Técnicas de de...Igor García Atutxa
Presentacion del Trabajo Fin de Master Modelizacion e Investigacion Matemática, Estadistica y Computación. Implementación en Android
de detector de elementos de la red eléctrica utilizando técnicas de Deep Learning.
Trabajo Fin de Grado Ingeniería Electrónica. Aspectos históricos y técnicos d...Igor García Atutxa
Presentación Trabajo Fin de Grado Ingeniería Electrónica, facultad de Ciencia y Tecnología de la Universidad del Pais Vasco. Aspectos históricos y técnicos del RADAR
El principio de Huygens-Fresnel y el premio de la Academia de Ciencias de Par...Igor García Atutxa
La Academia de Ciencias de Paris otorga su premio a Fresnel por sus investigaciones de la difracción de la luz, demostrando que también se comporta como una onda. Consiguiendo este premio a pesar de las grandes reticencias de los cientificos corpusculares, liderados por Laplace.
1. Analisis correspondencias
2. Regresión logísitica
3. Regresión no lineal. Ajuste a una función logística de tres parámetros.
4. Estimación clásica vs estimación robusta.
5. Análisis de la varianza. Test de Welch y test
de Box.
6. Regresión robusta.
Curso tributación práctica. En este trabajo se lleva a cabo la contabilidad de una empresa informando de los asientos que se llevan a cabo. la liquidación del IVA y la regularización de ingresos y gastos.
1891 - 14 de Julio - Rohrmann recibió una patente alemana (n° 64.209) para s...Champs Elysee Roldan
El concepto del cohete como plataforma de instrumentación científica de gran altitud tuvo sus precursores inmediatos en el trabajo de un francés y dos Alemanes a finales del siglo XIX.
Ludewig Rohrmann de Drauschwitz Alemania, concibió el cohete como un medio para tomar fotografías desde gran altura. Recibió una patente alemana para su aparato (n° 64.209) el 14 de julio de 1891.
En vista de la complejidad de su aparato fotográfico, es poco probable que su dispositivo haya llegado a desarrollarse con éxito. La cámara debía haber sido accionada por un mecanismo de reloj que accionaría el obturador y también posicionaría y retiraría los porta películas. También debía haber sido suspendido de un paracaídas en una articulación universal. Tanto el paracaídas como la cámara debían ser recuperados mediante un cable atado a ellos y desenganchado de un cabrestante durante el vuelo del cohete. Es difícil imaginar cómo un mecanismo así habría resistido las fuerzas del lanzamiento y la apertura del paracaídas.
La mycoplasmosis aviar es una enfermedad contagiosa de las aves causada por bacterias del género Mycoplasma. Esencialmente, afecta a aves como pollos, pavos y otras aves de corral, causando importantes pérdidas económicas en la industria avícola debido a la disminución en la producción de huevos y carne, así como a la mortalidad.
3. Biologı́a Estructural Igor Garcı́a Atutxa
1. Preguntas iniciales
1. ¿Qué problemas presenta la cristalografı́a de rayos X?
El mayor problema es la generación de cristales de proteı́nas perfectamente
ordenados sobre los que se pueda aplicar la técnica, que difracte los rayos X
obteniendo una señal óptima.
2. ¿En que dos circunstancias se suele emplear RMN por encima de
cristalografı́a de rayos X?
Cuando nos encontramos con biomoléculas no cristalizables o para estudiar
moléculas en disolución o en contacto con otras.
3. ¿Qué condiciones tienen que cumplir las proteı́nas para poder
determinar su estructura por RMN?
Las biomoléculas deben de ser solubles y tienen una limitación de tamaño
(record actual 800 aminoácidos).
4. ¿Qué tipo de alineamiento refleja con mas fiabilidad las secuencias
con una relación evolutiva lejana?
Alineamiento múltiple de secuencias.
5. ¿Qué diferencias hay entre secuencias ortólogas y parálogas?
Las secuencias ortólogas son aquellas cuya similitud deriva de una ascenden-
cia común. En cambio, son parálogas cuando la similitud entre secuencias se
produce dentro del mismo genoma.
6. ¿En que nos basamos para modelar los giros?
En el número de aminoácidos que tienen y en las estructuras secundarias que
conectan.
7. ¿Qué condición se debe cumplir para obtener un buen modelo por
homologı́a?
Cuando se conoce que la estructura que se busca es parecida a otra que ya
se ha determinado experimentalmente.
8. ¿Qué es y en que se basa el reconocimiento de plegado?
El reconocimiento de plegado pretende encontrar la conformación que adop-
tarán los aminoácidos de una secuencia, mediante herramientas informáticas.
Esta técnica se basa en el procesamiento de secuencias polipeptı́dicas y las
relaciona con varias conformaciones conocidas hasta que los algoritmos de
computación determinan cuál de las conformaciones proporciona la energı́a
de estabilidad óptima para el polipéptido.
9. ¿Se puede determinar completamente la estructura secundaria de
una proteı́na a partir de la secuencia?
Completamente no. Se pueden hacer predicciones que son acertadas en el
60 % o 70 % de los casos.
10. ¿Es adecuado utilizar el modelado ab initio para diseño de
fármacos? Razonad la respuesta.
2
4. Biologı́a Estructural Igor Garcı́a Atutxa
Sı́, muy adecuado. El diseño de fármacos asistido por computadoras es una
de las herramientas mas eficaces actualmente.
En el diseño de estos fármacos se parte del diseño de la molécula. Se introduce
la nueva molécula en el software, dándonos información sobre esta (estado
mı́nima energı́a, estabilidad, isómeros...). Esa molécula que se esta diseñando
se puede introducir en una base de datos y contrastarla con otras ya existentes
de estructura similar. Por contraste con estas últimas, se podrı́a predecir que
funcionalidades deberı́a tener la nueva molécula.
3
5. Biologı́a Estructural Igor Garcı́a Atutxa
2. Enunciado
2.1. Ejercicio 1: Predicción de estructura por homologı́a
Alineamiento de las dos secuencias mediante el programa EMBOSS NEEDLE.
Figura 1: Captura del alineamiento de las dos secuencias.
Explorad el alineamiento y decidid a partir de éste si son dos
proteı́nas más o menos parecidas. Explicad por qué a partir de
los sı́mbolos del alineamiento.
Son parecidos, tienen un número pequeño de gaps y su número de
coincidencias (identidad) es superior a una cuarta parte, alcanzado casi un
50 % en la similitud fisicoquı́mica entre aminoácidos.
Alineamiento utilizando ahora el programa SWISS MODEL
4
6. Biologı́a Estructural Igor Garcı́a Atutxa
Figura 2: Alineamiento de las dos secuencias con el programa SWISS MODEL.
Verificamos que el alineamiento es correcto y construimos el modelo, obtenemos
la siguiente imagen:
Figura 3: Captura del alineamiento de las dos secuencias.
Enumerad las partes más importantes de la salida del programa,
los gráficos, etc. y qué significan.
En la gráfica se muestra el template, la identidad de la secuencia, el GMQE
y QMEANDisCo que valoran el modelo.
Analizad los resultados que habéis obtenido: la calidad del
alineamiento de secuencias, de las estructuras secundarias y todos
los parámetros que evalúan la calidad del modelo.
GMQE = 0.57 y QMEANDisCo = 0.63 ± 0.08
En base a todo lo anterior, ¿es un buen modelo?
Sı́, ya que lo explica en un 60 %.
Podemos visualizar las proteı́nas en nuestro ordenador usando diferentes
programas. En nuestro caso utilizaremos RASMOL.
Plasmad el dibujo realizado por vosotros con RASMOL en vuestra
PEC y comparad visualmente ambas proteı́nas (el modelo y la
experimental).
5
7. Biologı́a Estructural Igor Garcı́a Atutxa
Figura 4: Dibujo del modelo utilizando la herramienta RASMOL (Mostrar =
cintas, Colores= estructura).
Figura 5: Dibujo de la proteı́na experimental utilizando la herramienta RASMOL
(Mostrar = cintas, Colores= estructura).
¿Detectáis alguna diferencia?
6
8. Biologı́a Estructural Igor Garcı́a Atutxa
¿En qué regiones está mejor resuelto nuestro modelo? ¿Por qué?
¿Pensáis que vuestro modelo es aceptable? ¿Se podrı́a mejorar?
¿Se os ocurre alguna manera de hacerlo?
Explicad la/s estrategia/s que utilizarı́ais a partir de lo que se
explica en los materiales de la asignatura.
Ahora utilizaremos el método automático para buscar secuencias parecidas en
SWISS MODEL.
En este caso solo pondremos la secuencia de tioredoxina para E.coli y
el programa busca los mejores templates para modelar nuestra secuencia.
Seleccionamos Search for templates.
¿Qué 5 templates de PDB salen en las primeras posiciones?
Figura 6: Primeras 5 posiciones de templates utilizando la funcionalidad search
for templates de SWISS MODEL para tioredoxina E.coli.
¿Qué identidad de secuencia tienen respecto a la secuencia de
E.coli?
90 % las cuatro primeras y 89 % la quinta.
¿A qué especies pertenecen?
7
9. Biologı́a Estructural Igor Garcı́a Atutxa
Ahora seleccionamos Build Models con, por ejemplo, el primer template.
Plasmad el output del programa en vuestra PEC y analizad todos
los parámetros que evalúan el modelo resultante.
Figura 7: Primeras 5 posiciones de templates utilizando la funcionalidad search
for templates de SWISS MODEL para tioredoxina E.coli.
A partir de estos, decidid si el modelo ha mejorado respecto al
primero que hemos obtenido. Razonad la respuesta.
8
10. Biologı́a Estructural Igor Garcı́a Atutxa
2.2. Ejercicio 2: Predicción de estructura por reconoci-
miento de plegado o threading
Para esta predicción utilizaremos el programa PHYRE para la proteı́na de
transporte del molibdeno delorganismo E.coli.
Mientras esperáis los resultados leed el siguiente texto y describid
en pocas palabras qué hace el programa y qué resultados se
obtienen (es recomendable también releer los materiales de la
asignatura para recordar en qué consiste el threading):
Este sistema está diseñado en torno a la idea de predecir la estructura
tridimensional que tiene una secuencia de proteı́na o gen. Utiliza la alineación
de modelos ocultos de Markov para mejorar significativamente la precisión
de la alineación y tasa de detección. Phyre2 también incorpora una nueva
simulación de plegado llamado para modelar regiones de proteı́nas sin
homologı́a detectable con estructuras conocidas.
Plasmad en vuestra PEC el output del programa.
Figura 8: Output programa PHYRE2.
¿Qué PDBs se encuentran en las primeras seis posiciones?
3D31, 2ONK y 2R6G.
¿Cuál es la confianza de los seis primeros hits? ¿Qué significa este
parámetro?
100 %. La probabilidad de que la secuencia y el template sean homólogos.
¿Qué identidad de secuencia tienen estos hits respecto a la
secuencia problema?
33 %, 33 %, 31 %, 31 %, 23 % y 21 %, respectivamente.
9
11. Biologı́a Estructural Igor Garcı́a Atutxa
Plasmad en el papel el dibujo del mejor modelo obtenido para esta
proteı́na.
Figura 9: Mejor modelo obtenido.
¿A partir de qué proteı́na se ha obtenido?
ATP-binding protein.
¿A qué organismo pertenece?
Methanosarcina acetivorans C2A.
Ahora escogemos el primer hit. ¿En qué función (según PDB) está
implicada esta proteı́na? ¿Y los siguientes hits?
Primer hit hydrolase/transport protein, segundo hit transport protein, tercer
hit protein binding, cuarto hit protein binding, quinto hit ABC-type maltose
transporter activity, sexto hit ABC-type maltose transporter activity.
Buscad a qué fold, superfamilia y familia pertenece según SCOP
el primer hit.
Fold = ABC domain-like, superfamily = ABC transporter-like P-loop
ATPases y family= ABC transporter ATPase domain-like
Ahora mirad en UNIPROT nuestra secuencia problema y observad
en qué proceso biológico está implicada.
10
12. Biologı́a Estructural Igor Garcı́a Atutxa
¿Qué tipo de relación existe entre la secuencia problema y los dos
primeros hits?¿Tienen el mismo fold?
¿Existe relación funcional entre los modelos obtenidos y la
secuencia incógnita?
¿Podrı́ais utilizar el método de modelado por homologı́a del
ejercicio 1 teniendo en cuenta la identidad de secuencia de todos
los hits obtenidos? ¿Por qué?(consultad la sección de los materiales
de la asignatura que trata sobre el modelado por homologı́a).
Podéis calcular la calidad del modelo con Run investigator para el
primer modelo. En base a los parámetros obtenidos:
¿Creéis que el modelo es bueno? Razonad la respuesta.
¿Por qué razón hemos obtenido un buen modelo a pesar de tener
baja identidad de secuencia?
11
13. Biologı́a Estructural Igor Garcı́a Atutxa
2.3. Ejercicio 3: Predicción de estructura ab initio
Ahora construiremos un modelo a partir solo de la secuencia de una proteı́na,
sin conocimiento previo de plegados conocidos (threading) ni tampoco de estruc-
turas de proteı́nas con secuencia parecida (modelado por homologı́a). Esto se hará
con el programa PEP-FOLD y utilizaremos el modelo de la insulina Bos taurus.
Comparamos visualmente con RASMOL la estructura cristalográfica experi-
mental 6Q8Q de Bos taurus (recordad que la cadena de la insulina es la B, ası́
que pondréis el comando restrict *B) con el modelo obtenido. Poned las capturas
de pantalla en la PEC.
Figura 10: Visualización mediante RASMOL de las estructura experimental
6Q8Q.
12
14. Biologı́a Estructural Igor Garcı́a Atutxa
Figura 11: Visualización mediante PEP-FOLD del modelo de la insulina Bos
taurus.
A partir de las estructuras: ¿Qué diferencias observáis a nivel
estructural?¿Creéis que habéis obtenido un buen modelo?
¿Creéis que este modelo es mejor que un modelo por homologı́a?
¿Por qué?
¿Qué se os ocurrirı́a para mejorarlo?
13