Este documento resume una sesión de formación sobre el uso de herramientas bioinformáticas para la investigación biomédica. La sesión cubre BLAST y navegadores genómicos, explicando cómo BLAST busca homologías comparando secuencias contra bases de datos usando alineamientos y matrices de sustitución, y proporcionando criterios como E-values para evaluar los resultados. También presenta ejemplos de uso de BLAST en NCBI y navegadores genómicos como Ensembl, NCBI y UCSC.
1) El documento trata sobre la sintaxis y semántica de la lógica proposicional. Define el lenguaje proposicional y las fórmulas bien formadas.
2) Presenta ejercicios sobre identificación de fórmulas bien formadas, eliminación de paréntesis innecesarios, construcción de árboles de análisis y tablas de verdad.
3) Explica conceptos como valuación, satisfacción de fórmulas, tautologías, contradicciones y contingencias. Propone ejerc
AGRF in conjunction with EMBL Australia recently organised a workshop at Monash University Clayton. This workshop was targeted at beginners and biologists who are new to analysing Next-Gen Sequencing data. The workshop also aimed to provide users with a snapshot of bioinformatics and data analysis tips on how to begin to analyse project data. An introduction to RNA-seq data analysis was presented by AGRF Senior Bioinformatician Dr. Sonika Tyagi.
Presented: 1st August 2012
Course: Bioinformatics for Biomedical Research (2014).
Session: 4.1- Introduction to RNA-seq and RNA-seq Data Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
This document provides an introduction to metagenomics. It defines metagenomics as the study of microbial communities directly in their natural environments using modern genomics techniques. The document outlines the historical context and basic purpose of metagenomics. It describes some of the applications of metagenomics, such as understanding the human microbiome, bioremediation, bioenergy production, and smart farming. Finally, it introduces some basic concepts in metagenomics analysis including binning, OTUs, alpha and beta diversity measurements, and challenges around estimating diversity from samples.
Course: Bioinformatics for Biomedical Research (2014).
Session: 4.2- Introduction to Functional Analysis with IPA.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 3.2- Basic Aspects of Microarray Technology and Data Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 3.1- Brief Overview to Amplicon Variant Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.3- Introduction to NGS Variant Calling Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
1) El documento trata sobre la sintaxis y semántica de la lógica proposicional. Define el lenguaje proposicional y las fórmulas bien formadas.
2) Presenta ejercicios sobre identificación de fórmulas bien formadas, eliminación de paréntesis innecesarios, construcción de árboles de análisis y tablas de verdad.
3) Explica conceptos como valuación, satisfacción de fórmulas, tautologías, contradicciones y contingencias. Propone ejerc
AGRF in conjunction with EMBL Australia recently organised a workshop at Monash University Clayton. This workshop was targeted at beginners and biologists who are new to analysing Next-Gen Sequencing data. The workshop also aimed to provide users with a snapshot of bioinformatics and data analysis tips on how to begin to analyse project data. An introduction to RNA-seq data analysis was presented by AGRF Senior Bioinformatician Dr. Sonika Tyagi.
Presented: 1st August 2012
Course: Bioinformatics for Biomedical Research (2014).
Session: 4.1- Introduction to RNA-seq and RNA-seq Data Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
This document provides an introduction to metagenomics. It defines metagenomics as the study of microbial communities directly in their natural environments using modern genomics techniques. The document outlines the historical context and basic purpose of metagenomics. It describes some of the applications of metagenomics, such as understanding the human microbiome, bioremediation, bioenergy production, and smart farming. Finally, it introduces some basic concepts in metagenomics analysis including binning, OTUs, alpha and beta diversity measurements, and challenges around estimating diversity from samples.
Course: Bioinformatics for Biomedical Research (2014).
Session: 4.2- Introduction to Functional Analysis with IPA.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 3.2- Basic Aspects of Microarray Technology and Data Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 3.1- Brief Overview to Amplicon Variant Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.3- Introduction to NGS Variant Calling Analysis.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.2- Introduction to Galaxy. A web-based genome analysis platform.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.3- Next Generation Sequencing. Technologies and Applications. Part III: NGS Applications II.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.2- Next Generation Sequencing. Technologies and Applications. Part II: NGS Applications I.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.1- Next Generation Sequencing. Technologies and Applications. Part I: NGS Introduction and Technology Overview.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 1.2- Storing and Accessing Information. Databases and Queries.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
This document provides an introduction to bioinformatics. It defines bioinformatics as the interdisciplinary field that develops methods for storing, organizing, and analyzing vast amounts of biological data generated by new technologies. It discusses the explosive growth of genomic and protein data. It also describes the roles and skills of bioinformaticians, including knowledge of biology, computer science, and quantitative disciplines. Finally, it outlines where bioinformatics is typically conducted, such as specialized centers and universities, and how it is usually done through online and open source solutions.
Course: Bioinformatics for Biomedical Research (2014).
Session: 1.3- Genome Browsing, Genomic Data Mining and Genome Data Visualization with Ensembl, Biomart and IGV.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
1) The document discusses using the Tiki Wiki CMS system to manage information flows at the Statistics and Bioinformatics Unit at Vall d'Hebron Institut de Recerca.
2) Key features of Tiki that are highlighted include wiki pages, structures and permissions to manage documentation, trackers for databases, and calendars for planning. It also allows connecting R to the web through plugins.
3) Examples provided include using Tiki to create task trackers, study databases, and an interactive heatmap tool powered by R. The system allows automating workflows and sharing results in a customizable centralized system.
This document discusses real-time quantitative PCR (RT-qPCR) data analysis. It outlines topics including normalization, absolute and relative quantification methods, and data analysis pipelines. For normalization, it describes correcting for systematic variation between samples through methods like using housekeeping genes or internal calibrators. It also explains that absolute quantification uses a standard curve of known copy numbers, while relative quantification compares target and reference gene expression ratios, such as through the delta-delta Ct method. The document provides examples of calculating fold changes between samples or tissues.
Este documento presenta un resumen del seminario sobre la técnica de RTqPCR realizado en 2012. Describe las diferentes etapas de un experimento de RTqPCR, incluyendo la definición de la técnica, la terminología asociada, el flujo de trabajo con etapas como el diseño experimental, la preparación y extracción de muestras, la transcripción reversa, la reacción en cadena de la polimerasa cuantitativa y la validación y análisis de los resultados. El documento proporciona información fundamental sobre esta importante técnica de biolog
El resumen analiza los principios básicos del diseño experimental y el proceso de análisis de datos de microarrays. Explica que un buen diseño experimental sigue principios como la aleatorización, la replicación y el bloqueo para minimizar errores sistemáticos y maximizar la precisión. También describe los diferentes tipos de estudios de microarrays, como la comparación de clases y el descubrimiento de clases, así como las herramientas disponibles para el análisis.
Este documento describe un curso sobre tecnologías de alto rendimiento en genómica que se llevará a cabo del 28 de noviembre al 5 de diciembre. El curso cubrirá técnicas como microarrays, RT-qPCR, secuenciación masiva y análisis de resultados de estas técnicas. Los temas incluyen tipos de microarrays, cómo se fabrican, calidad y cantidad de RNA de partida, y procedimientos de microarrays.
Este documento describe la tecnología de arrays de proteínas y su aplicación en el estudio de interacciones proteína-proteína. Se explica el flujo de trabajo de un ensayo con arrays de proteínas reversas utilizando la tecnología Zeptosens. También se detalla la optimización del servicio de arrays de proteínas en la Unidad de Análisis Traslacional mediante el uso de lisados celulares y anticuerpos validados.
This document provides an introduction and overview of next-generation sequencing (NGS) data analysis. It discusses the bioinformatics challenges posed by large NGS datasets, including the need for powerful computing infrastructure and data storage. The document outlines common NGS data analysis workflows and applications, such as quality control, metagenomics, de novo assembly, amplicon analysis and variant detection. It also compares different NGS platforms and provides examples of software tools used in NGS data analysis.
Este documento describe un curso sobre tecnologías de secuenciación de nueva generación. El curso cubre las tecnologías 454 de Roche, comparaciones con otros sistemas de secuenciación masiva paralela, y aplicaciones como el estudio de quasiespecies virales, secuenciación de genomas de novo, metagenómica, RNA-seq, y análisis de exomas y mutaciones en leucemia mediante arrays de captura de secuencia. El curso también cubre el análisis de datos de secuenciación masiva paralela.
El documento describe diferentes aplicaciones de las tecnologías de secuenciación masiva (NGS) como el estudio de cuasiespecies virales, estudios de metagenómica, secuenciación de genomas completos y RNAseq. Específicamente, se detalla cómo la NGS puede utilizarse para detectar variantes minoritarias en poblaciones virales y estudiar la diversidad microbiana en muestras ambientales sin necesidad de cultivo.
High throughput technologies in Genomics - Tecnologías de alto rendimiento en genómica.
Session 3: Statistical Analysis
Course held at Vall d'Hebron Research Institute (VHIR), in Barcelona, Catalonia, Spain, on October 5th, 2011.
El documento describe las tecnologías de RT-qPCR. La RT-qPCR permite la cuantificación cualitativa y cuantitativa de ácidos nucleicos en tiempo real. La técnica implica la extracción de RNA, transcripción reversa a cDNA, y amplificación por PCR cuantitativa en tiempo real para medir los niveles de expresión génica. La RT-qPCR ofrece mayor sensibilidad y rango dinámico que otras técnicas como la PCR convencional.
High throughput technologies in Genomics - Tecnologías de alto rendimiento en genómica.
Session 1: Microarrays
Course held at Vall d'Hebron Research Institute (VHIR), in Barcelona, Catalonia, Spain, on October 5th, 2011.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.2- Introduction to Galaxy. A web-based genome analysis platform.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.3- Next Generation Sequencing. Technologies and Applications. Part III: NGS Applications II.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.2- Next Generation Sequencing. Technologies and Applications. Part II: NGS Applications I.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 2.1.1- Next Generation Sequencing. Technologies and Applications. Part I: NGS Introduction and Technology Overview.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
Course: Bioinformatics for Biomedical Research (2014).
Session: 1.2- Storing and Accessing Information. Databases and Queries.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
This document provides an introduction to bioinformatics. It defines bioinformatics as the interdisciplinary field that develops methods for storing, organizing, and analyzing vast amounts of biological data generated by new technologies. It discusses the explosive growth of genomic and protein data. It also describes the roles and skills of bioinformaticians, including knowledge of biology, computer science, and quantitative disciplines. Finally, it outlines where bioinformatics is typically conducted, such as specialized centers and universities, and how it is usually done through online and open source solutions.
Course: Bioinformatics for Biomedical Research (2014).
Session: 1.3- Genome Browsing, Genomic Data Mining and Genome Data Visualization with Ensembl, Biomart and IGV.
Statistics and Bioinformatisc Unit (UEB) & High Technology Unit (UAT) from Vall d'Hebron Research Institute (www.vhir.org), Barcelona.
1) The document discusses using the Tiki Wiki CMS system to manage information flows at the Statistics and Bioinformatics Unit at Vall d'Hebron Institut de Recerca.
2) Key features of Tiki that are highlighted include wiki pages, structures and permissions to manage documentation, trackers for databases, and calendars for planning. It also allows connecting R to the web through plugins.
3) Examples provided include using Tiki to create task trackers, study databases, and an interactive heatmap tool powered by R. The system allows automating workflows and sharing results in a customizable centralized system.
This document discusses real-time quantitative PCR (RT-qPCR) data analysis. It outlines topics including normalization, absolute and relative quantification methods, and data analysis pipelines. For normalization, it describes correcting for systematic variation between samples through methods like using housekeeping genes or internal calibrators. It also explains that absolute quantification uses a standard curve of known copy numbers, while relative quantification compares target and reference gene expression ratios, such as through the delta-delta Ct method. The document provides examples of calculating fold changes between samples or tissues.
Este documento presenta un resumen del seminario sobre la técnica de RTqPCR realizado en 2012. Describe las diferentes etapas de un experimento de RTqPCR, incluyendo la definición de la técnica, la terminología asociada, el flujo de trabajo con etapas como el diseño experimental, la preparación y extracción de muestras, la transcripción reversa, la reacción en cadena de la polimerasa cuantitativa y la validación y análisis de los resultados. El documento proporciona información fundamental sobre esta importante técnica de biolog
El resumen analiza los principios básicos del diseño experimental y el proceso de análisis de datos de microarrays. Explica que un buen diseño experimental sigue principios como la aleatorización, la replicación y el bloqueo para minimizar errores sistemáticos y maximizar la precisión. También describe los diferentes tipos de estudios de microarrays, como la comparación de clases y el descubrimiento de clases, así como las herramientas disponibles para el análisis.
Este documento describe un curso sobre tecnologías de alto rendimiento en genómica que se llevará a cabo del 28 de noviembre al 5 de diciembre. El curso cubrirá técnicas como microarrays, RT-qPCR, secuenciación masiva y análisis de resultados de estas técnicas. Los temas incluyen tipos de microarrays, cómo se fabrican, calidad y cantidad de RNA de partida, y procedimientos de microarrays.
Este documento describe la tecnología de arrays de proteínas y su aplicación en el estudio de interacciones proteína-proteína. Se explica el flujo de trabajo de un ensayo con arrays de proteínas reversas utilizando la tecnología Zeptosens. También se detalla la optimización del servicio de arrays de proteínas en la Unidad de Análisis Traslacional mediante el uso de lisados celulares y anticuerpos validados.
This document provides an introduction and overview of next-generation sequencing (NGS) data analysis. It discusses the bioinformatics challenges posed by large NGS datasets, including the need for powerful computing infrastructure and data storage. The document outlines common NGS data analysis workflows and applications, such as quality control, metagenomics, de novo assembly, amplicon analysis and variant detection. It also compares different NGS platforms and provides examples of software tools used in NGS data analysis.
Este documento describe un curso sobre tecnologías de secuenciación de nueva generación. El curso cubre las tecnologías 454 de Roche, comparaciones con otros sistemas de secuenciación masiva paralela, y aplicaciones como el estudio de quasiespecies virales, secuenciación de genomas de novo, metagenómica, RNA-seq, y análisis de exomas y mutaciones en leucemia mediante arrays de captura de secuencia. El curso también cubre el análisis de datos de secuenciación masiva paralela.
El documento describe diferentes aplicaciones de las tecnologías de secuenciación masiva (NGS) como el estudio de cuasiespecies virales, estudios de metagenómica, secuenciación de genomas completos y RNAseq. Específicamente, se detalla cómo la NGS puede utilizarse para detectar variantes minoritarias en poblaciones virales y estudiar la diversidad microbiana en muestras ambientales sin necesidad de cultivo.
High throughput technologies in Genomics - Tecnologías de alto rendimiento en genómica.
Session 3: Statistical Analysis
Course held at Vall d'Hebron Research Institute (VHIR), in Barcelona, Catalonia, Spain, on October 5th, 2011.
El documento describe las tecnologías de RT-qPCR. La RT-qPCR permite la cuantificación cualitativa y cuantitativa de ácidos nucleicos en tiempo real. La técnica implica la extracción de RNA, transcripción reversa a cDNA, y amplificación por PCR cuantitativa en tiempo real para medir los niveles de expresión génica. La RT-qPCR ofrece mayor sensibilidad y rango dinámico que otras técnicas como la PCR convencional.
High throughput technologies in Genomics - Tecnologías de alto rendimiento en genómica.
Session 1: Microarrays
Course held at Vall d'Hebron Research Institute (VHIR), in Barcelona, Catalonia, Spain, on October 5th, 2011.
Más de VHIR Vall d’Hebron Institut de Recerca (20)
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial ValenciaAMADO SALVADOR
Descubra el catálogo completo de buzones BTV, una marca líder en la fabricación de buzones y cajas fuertes para los sectores de ferretería, bricolaje y seguridad. Como distribuidor oficial de BTV, Amado Salvador se enorgullece de presentar esta amplia selección de productos diseñados para satisfacer las necesidades de seguridad y funcionalidad en cualquier entorno.
Descubra una variedad de buzones residenciales, comerciales y corporativos, cada uno construido con los más altos estándares de calidad y durabilidad. Desde modelos clásicos hasta diseños modernos, los buzones BTV ofrecen una combinación perfecta de estilo y resistencia, garantizando la protección de su correspondencia en todo momento.
Amado Salvador, se compromete a ofrecer productos de primera clase respaldados por un servicio excepcional al cliente. Como distribuidor oficial de BTV, entendemos la importancia de la seguridad y la tranquilidad para nuestros clientes. Por eso, trabajamos en colaboración con BTV para brindarle acceso a los mejores productos del mercado.
Explore el catálogo de buzones ahora y encuentre la solución perfecta para sus necesidades de correo y seguridad. Confíe en Amado Salvador y BTV para proporcionarle buzones de calidad excepcional que cumplan y superen sus expectativas.
KAWARU CONSULTING presenta el projecte amb l'objectiu de permetre als ciutadans realitzar tràmits administratius de manera telemàtica, des de qualsevol lloc i dispositiu, amb seguretat jurídica. Aquesta plataforma redueix els desplaçaments físics i el temps invertit en tràmits, ja que es pot fer tot en línia. A més, proporciona evidències de la correcta realització dels tràmits, garantint-ne la validesa davant d'un jutge si cal. Inicialment concebuda per al Ministeri de Justícia, la plataforma s'ha expandit per adaptar-se a diverses organitzacions i països, oferint una solució flexible i fàcil de desplegar.
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialAMADO SALVADOR
Explora el catálogo completo de cajas fuertes BTV, disponible a través de Amado Salvador, distribuidor oficial de BTV. Este catálogo presenta una amplia variedad de cajas fuertes, cada una diseñada con la más alta calidad para ofrecer la máxima seguridad y satisfacer las diversas necesidades de protección de nuestros clientes.
En Amado Salvador, como distribuidor oficial de BTV, ofrecemos productos que destacan por su innovación, durabilidad y robustez. Las cajas fuertes BTV son reconocidas por su eficiencia en la protección contra robos, incendios y otros riesgos, lo que las convierte en una opción ideal tanto para uso doméstico como comercial.
Amado Salvador, distribuidor oficial BTV, asegura que cada producto cumpla con los más estrictos estándares de calidad y seguridad. Al adquirir una caja fuerte a través de Amado Salvador, distribuidor oficial BTV, los clientes pueden tener la tranquilidad de que están obteniendo una solución confiable y duradera para la protección de sus pertenencias.
Este catálogo incluye detalles técnicos, características y opciones de personalización de cada modelo de caja fuerte BTV. Desde cajas fuertes empotrables hasta modelos de alta seguridad, Amado Salvador, como distribuidor oficial de BTV, tiene la solución perfecta para cualquier necesidad de seguridad. No pierdas la oportunidad de conocer todos los beneficios y características de las cajas fuertes BTV y protege lo que más valoras con la calidad y seguridad que solo BTV y Amado Salvador, distribuidor oficial BTV, pueden ofrecerte.
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaAMADO SALVADOR
Descubre el catálogo general de la gama de productos de refrigeración del fabricante de electrodomésticos Miele, presentado por Amado Salvador distribuidor oficial Miele en Valencia. Como distribuidor oficial de electrodomésticos Miele, Amado Salvador ofrece una amplia selección de refrigeradores, congeladores y soluciones de refrigeración de alta calidad, resistencia y diseño superior de esta marca.
La gama de productos de Miele se caracteriza por su innovación tecnológica y eficiencia energética, garantizando que cada electrodoméstico no solo cumpla con las expectativas, sino que las supere. Los refrigeradores Miele están diseñados para ofrecer un rendimiento óptimo y una conservación perfecta de los alimentos, con características avanzadas como la tecnología de enfriamiento Dynamic Cooling, sistemas de almacenamiento flexible y acabados premium.
En este catálogo, encontrarás detalles sobre los distintos modelos de refrigeradores y congeladores Miele, incluyendo sus especificaciones técnicas, características destacadas y beneficios para el usuario. Amado Salvador, como distribuidor oficial de electrodomésticos Miele, garantiza que todos los productos cumplen con los más altos estándares de calidad y durabilidad.
Explora el catálogo completo y encuentra el refrigerador Miele perfecto para tu hogar con Amado Salvador, el distribuidor oficial de electrodomésticos Miele.
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Curs einesbioinformatiques juny2011_bloc1_sessio3
1. Curs de Formació UEB
Eines bioinformàtiques per a la
investigació biomèdica
1r bloc: Introducció a la
Bioinformàtica i les bases de dades
Aplicacions guiades:
3ª sessió:
Blast. Genome Browsers.
Ferran Briansó (tècnic UEB)
ferran.brianso@vhir.org
https://ueb.ir.vhebron.net
Vall d'Hebron Institut de Recerca 21/06/2011
2. Sesión 3 – Índice de contenidos
BLAST
- Motivación: predicción funcional
- Similaridad vs Homología
- Alineamiento por parejas
– Sistemas de puntuación
– Sistemas de puntuación para proteínas
– Matrices de substitución (PAM, BLOSUM)
- BLAST (Alineamiento contra BD)
– Blast en NCBI
– ¿Cómo funciona?
– Parámetros, criterios, Bit-scores, E-values
– ¿Dónde cortar?
– ¿Existe homología?
GENOME BROWSERS
- Ensembl
- NCBI Map Viewer
- UCSC
- VEGA
Vall d'Hebron Institut de Recerca 21/06/2011
3. BLAST
Búsqueda de homologías
Vall d'Hebron Institut de Recerca 21/06/2011
4. Predicción funcional de una
proteína/gen
- Secuencia problema:
Queremos averiguar sus posibles propiedades.
- La evolución es un proceso conservativo
Cambian los residuos en una secuencia pero se conservan
las propiedades bioquímicas y los procesos fisiológicos
- Si somos capaces de encontrar secuencias
homólogas a la secuencia problema podemos
inferir que ésta “debe de tener” propiedades
similares a las de la secuencia conocida.
- La búsqueda (el hallazgo, de hecho) de secuencias
homólogas puede ser una vía para predecir la
función de una proteína o un gen.
Vall d'Hebron Institut de Recerca 21/06/2011
5. Similaridad vs Homología
- Homología:
- Descendencia de un ancestro común
- Medida cualitativa: dos secuencias son homólogas o
no lo son
- Similaridad
- Medida cuantitativa para determinar el grado de
relación entre dos secuencias
- Podemos usar una medida de similaridad para inferir
homología
Vall d'Hebron Institut de Recerca 21/06/2011
6. Sistemas de puntuación
- Queremos medir el grado de similaridad de dos secuencias
- Es necesario definir un criterio(sistema de puntuación)
que evalue esta similaridad
Ejemplo:
- Match=1
- Mismatch=0
S= A T G C A G T
T= A T A A G T
Vall d'Hebron Institut de Recerca 21/06/2011
7. Sistemas de puntuación
- El alineamiento de las secuencias puede aumentar
la puntuación:
- Match=1
S= A T G C A G T
- Mismatch=0
T= A T A A G T
- Gap=-1 p(s,t) 1 1 0 0 0 0 Σ= 2
S= A T G C A G T
T= A T A A ▬ G T
p(s,t) 1 1 0 0 -1 1 1 Σ= 3
S= A T G C A G T
T= A T ▬ A A G T
Vall d'Hebron Institut de Recerca 21/06/2011
8. Sistemas de puntuación
- Match=1 S= A T G C A G T
T= A T A A G T
- Mismatch=-1 p(s,t) 1 1 -1 -1 -1 -1 Σ= -2
- Gap Open=-3
- Gap Ext.=-2
S= A T G C A G T
T= A T A A ▬ G T
p(s,t) 1 1 -1 -1 -5 1 1 Σ= -3
S= A T G C A G T
T= A T ▬ A A G T
p(s,t) 1 1 -5 -1 1 1 1 Σ= -1
Vall d'Hebron Institut de Recerca 21/06/2011
9. Sistemas de puntuación
para proteínas
- Match=1
- Mismatch=0
- Gap=-1
S= T T Y G A P P W C S
T= − T G Y A P P P W S
p(s,t) -1 1 0 0 1 1 1 0 0 1 Σ= 4
S= T T Y G A P P W C S
T= T G Y A P P P W S −
Vall d'Hebron Institut de Recerca 21/06/2011
10. Sistemas de puntuación
para proteínas
Los AA tienen distintas propiedades
posibilidades distintas de ser sustituidos unos
por otros en la evolucion
tiny
P
aliphatic C S+S small
G
I A G S
V CSH N
L T D
hydrophobic M Y K E
F Q
W H R
positive
aromatic polar
charged
Vall d'Hebron Institut de Recerca 21/06/2011
11. Matrices de substitución
A 4
R
N
-1 5
-2 0 6
Pairwise alignment scores
D -2 -2 1 6 are determined using a
C 0 -3 -3 -3 9 scoring matrix such as
Q -1 1 0 0 -3 5
E -1 0 0 2 -4 2 5 Blosum62
G 0 -2 0 -1 -3 -2 -2 6
H -2 0 1 -1 -3 0 0 -2 8
I -1 -3 -3 -3 -1 -3 -3 -4 -3 4
L -1 -2 -3 -4 -1 -2 -3 -4 -3 2 4
K -1 2 0 -1 -1 1 1 -2 -1 -3 -2 5
M -1 -2 -2 -3 -1 0 -2 -3 -2 1 2 -1 5
F -2 -3 -3 -3 -2 -3 -3 -3 -1 0 0 -3 0 6
P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4 7
S 1 -1 1 0 -1 0 0 0 -1 -2 -2 0 -1 -2 -1 4
T 0 -1 0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1 1 5
W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1 1 -4 -3 -2 11
Y -2 -2 -2 -3 -2 -1 -2 -3 2 -1 -1 -2 -1 3 -3 -2 -2 2 7
V 0 -3 -3 -3 -1 -2 -2 -3 -3 3 1 -2 1 -1 -2 -2 0 -3 -1 4
A R N D C Q E G H I L K M F P S T W Y V
Vall d'Hebron Institut de Recerca 21/06/2011
12. Matrices de substitución
BLOSUM62
S= T T Y G A P P W C S
T= − T G Y A P P P W S
p(s,t) -1 5 -3 -3 4 7 7 -4 -2 4 Σ= 14
S= T T Y G A P P W C S
T= T G Y A P P P W − S
Vall d'Hebron Institut de Recerca 21/06/2011
13. Matrices de substitución
- No hay una matriz única que se pueda usar siempre
- Según la familia de proteínas y el grado de similitud
esperado se usará una u otra
- Las más utilizadas PAM y BLOSUM
- PAM: Percent Accepted Mutation Matrix
- Derivadas de alineamientos globales de secuencias próximas
- PAM40 PAM250. A mayor nº, mayor distancia evolutiva
- BLOSUM: BLOcks of amino acid SUbstitution Matrix
- Derivadas de alineamientos locales de secuencias distantes
- BLOSUM90 BLOSUM45 El nº representa porcentaje de
identidad
Vall d'Hebron Institut de Recerca 21/06/2011
14. Matrices de substitución
- Generalmente, la matrices BLOSUM funcionan mejor que
las PAM para búsquedas de similaridad local(Henikoff &
Henikoff, 1993).
- Cuando comparamos proteinas cercanas deberíamos
usar matrices PAM mas bajas o BLOSUM mas altas,
mientras que para proteinas distantes sería mas
conveniente el uso de matrices PAM mas altas o
BLOSUM mas bajas.
- Para búsquedas en BBDD sin información previa es
bastante comun el uso de una BLOSUM62.
Vall d'Hebron Institut de Recerca 21/06/2011
15. Alineamiento contra BD
Supongamos que buscamos secuencias homólogas a nuestra
secuencia problema.
- Una estrategia posible es hacer alineamientos contra una
base de datos de secuencias.
- El algoritmo de Smith-Waterman obtiene un alineamiento
local óptimo, dado un sistema de puntuacion dado
- Demasiado lento para buscar contra una BBDD
Vall d'Hebron Institut de Recerca 21/06/2011
16. Alineamiento vs BD
- El algoritmo BLAST(Basic Local Alignment Search Tool)
permite un rápida comparación(alineamiento) de una
secuencia problema contra una BBDD
- Es rápido y preciso (ademas, accesible via web)
- Algoritmo heurístico: puede obviar alineamientos
óptimos
Vall d'Hebron Institut de Recerca 21/06/2011
21. ¿Cómo funciona Blast?
- Fase 1: compilar una lista de palabras (w=3) con
score por encima de un threshold T (high-
scoring segment pairs (HSPs))
- Ejemplo: búsqueda para “human RBP”
…FSGTWYA…
Lista de palabras (w=3):
FSG SGT GTW TWY WYA
YSG TGT ATW SWY WFA
FTG SVT GSW TWF WYS
Vall d'Hebron Institut de Recerca 21/06/2011
22. ¿Cómo funciona Blast?
Fase 2:
- Escaneo de la base de datos para buscar
entradas que coincidan con la lista
compilada.
- Esto es relativamente rápido y fácil.
Vall d'Hebron Institut de Recerca 21/06/2011
23. ¿Cómo funciona Blast?
- Fase 3: cuando encontramos un hit
(es decir, una coincidencia entre una palabra y una entrada de la
BBDD), extender el hit en ambas direcciones.
- Calcular los “scores” a cada paso (usando la matriz de
substitución)
- Parar cuando la puntuación cae por debajo de cierto “cutoff”.
KENFDKARFSGTWYAMAKKDPEG RBP (query)
MKGLDIQKVAGTWYSLAMAASD lactoglobulin (hit)
extender extender
Hit!
Vall d'Hebron Institut de Recerca 21/06/2011
26. Bit-scores
- El valor de la puntuaciones obtenidas por un
emparejamiento carecen de sentido si no se
tiene en cuenta el tamaño de la base de datos
y el sistema de puntuación
- Los Bit-scores normalizan las puntuaciones
para independizarlas de ambos factores de
forma que podamos compararlas
Vall d'Hebron Institut de Recerca 21/06/2011
27. E-values
E = Kmn e-λS
- Dada una secuencia que ha obtenido una puntuacion E-
value es el número esperado de puntuaciones iguales o
superiores a las de dicha secuencia atribuibles al azar.
- Un E-value de 10 para una coincidencia significa, que, en
una base de datos de secuencias aleatorias del mismo
tamaño en la que se ha realizado la búsqueda, se podría
esperar encontrar hasta 10 coincidencias con la misma
puntuación o similar.
- El E-value es la medida de corte más utilizada en las
búsquedas en bases de datos. Sólo se informa de las
coincidencias que superan un nivel mínimo
- El E-value oscila entre 0 y cualquier valor
Vall d'Hebron Institut de Recerca 21/06/2011
28. ¿Dónde cortar?
- Valores bajos de E se pueden interpretar como un p-
valor (probabilidad de encontrar por azar una secuencia
con la misma puntuación o superior)
- Si queremos seguridad de que las seqs. que
encontramos son realmente homologas (mas
especificidad), tomaremos valores de corte pequeños
(E=0.05, 0.1 + Bit scores altos + Alto porcentaje de
identidad)
- Si, en cambio, nos interesa explorar y priorizamos no
perder información por delante de la seguridad (mas
sensibilidad), podemos relajar el punto de corte (E=1,
10 + Bit scores normales + Alto porcentaje de
identidad)
Vall d'Hebron Institut de Recerca 21/06/2011
29. ¿Existe homología?
>gb|AAA60147.1| placental protein 14 [Homo sapiens]
Length=162
Score = 33.9 bits (76), Expect = 0.34
Identities = 24/107 (22%), Positives = 46/107 (42%), Gaps = 11/107 (10%)
Query 28 RVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRLLNNWD-
86
+ K++ + + +GTW++MA + L + A V T + +L+ W+
Sbjct 5 QTKQDLELPKLAGTWHSMAMA-TNNISLMATLKAPLRVHITSLLPTPEDNLEIVLHRWEN
63
Query 87 -VCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTY 132
C + T +P KFK+ Y ++ ++DTDYD +
Sbjct 64 NSCVEKKVLGEKTGNPKKFKINYTVA--------NEATLLDTDYDNF 102
- RBP4 y PAEP:
Bit-score bajo, E-value 0.34, 22% identidad (“zona gris”).
- Pero son, en efecto, homólogas. Se puede comprovar
con una búsqueda BLAST con PAEP como secuencia
“query”, y se encuentran muchas lipocalinas.
Vall d'Hebron Institut de Recerca 21/06/2011