SlideShare una empresa de Scribd logo
1 de 72
Descargar para leer sin conexión
Bioinformática
#BioInfGRX
¿Qué es la bioinformática?
La bioinformática es la aplicación de tecnologías computacionales a la
gestión y análisis de datos biológicos.
El término se acuñó en 1970 por Paulien Hogeweg y Ben Hesper
2/67
ÁCIDOS NUCLÉICOS
3/67
¿Qué es el ADN?
4/67
De ADN a proteína
5/67
De ADN a proteína
6/67
7/67
De ADN a proteína
8/67
El código genético
es degenerado
9/67
10/67
De ADN a proteína
11/67
Campos de aplicación de la Bioinformática
▶ Medicina y medicina preventiva
▶ Microbiología
▶ Desarrollo de fármacos
▶ Resistencia antibiótica
▶ Biotecnología
▶ Agricultura
▶ Veterinaria
▶ Análisis forenses
▶ Muchas otros
12/67
Formas de aplicación de la Bioinformática
Genómica Proteómica
Transcriptómica Metabolómica
13/67
Ejemplo
Molde de ADN:
5’-ATGAAGTTTGGCACTTAA-3’
3’-TACTTCAAACCGTGAATT-5’
14/67
Ejemplo: Mioglobina
Secuencia:
GAGCATGTTGGCCTGGTCCTTTG
CTAGGTACTGTAGAGCAGGTGAG
AGAGTGAGGGGGAAGGACTCCAA
ATTAGACCAGTTCTTAGCCATGAA
GCAGAGACTCTGAAGCCAGACTA
CCTGGGTCCCAATCTTGGGCTTG
GTATTTCCTCGCTGTGTGACTCTG
GGTAAGTTACTTAACTTCTCTGTG
CCTCAGTTCTCTCAAGTGTAAA...
Aminoácidos:
MGLSDGEWQLVLNVWGKVEADIPG
HGQEVLIRLFKGHPETLEKFDKFKHL
...
15/67
Ejemplo: Mioglobina
16/67
Matemáticas
#BioinformaticsGRX
Alguien tendrá que traducir los
requerimientos biológicos en un
lenguaje entendible para la
máquina
18/67
19/67
Multitud de herramientas matemáticas
a nuestra disposición.
▶ Geometría diferencial
▶ Análisis
▶ Teoría de nudos
▶ Probabilidad y estadística
▶ Álgebra y álgebra abstracta
20/67
1.
Empecemos por
lo básico.
¿Cómo representamos el código genético?
22/67
Claves
▶ Simetrías
▶ Matrices
▶ Código degenerado
▶ Inmunidad al ruido
Una posible idea:
Discernir subconjuntos dentro del código genético y utilizar con ellos
lenguaje binario:
23/67
Aprovechar los algoritmos existentes:
24/67
Si denominamos :
Como el Kernel de la familia de matrices, inmediatamente podemos establecer una
conexión con nuestro código genético:
▶ Matrices de Hadamard y producto de Kronecker:
25/67
26/67
2.
Alineación
Bases
Una alineación entre dos (o más) secuencias es una
comparación entre los componentes de cada secuencia.
El análisis básico de secuencias consiste en preguntar si
hay dos o más secuencias relacionadas.
Una verdadera alineación de las secuencias biológicas es
aquella que refleja la relación evolutiva entre dos o más
secuencias que comparten un antepasado común
antepasado común.
28/67
Bases
La base de la alineación y el análisis de la secuencia se basa en el hecho
de que las secuencias biológicas se desarrollan a partir de secuencias
preexistentes en lugar de ser inventado por la naturaleza desde el
principio.
29/67
A esto debemos añadirle tres fenómenos principales:
▶ Mutaciones puntuales
▶ Inserciones
▶ Delecciones
Bases
Además de los conceptos biológicos, debemos hacernos preguntas
específicas con las que deberemos trabajar, y de las que dependerá nuestro
método:
▶ ¿Qué tipo de alineamiento estamos buscando?
▶ ¿Qué puntuación aplicamos al alineamiento?
▶ ¿Qué algoritmo desarrollamos de forma óptima para llevar nuestro método a la máquina?
▶ ¿Cuál es la significación estadística de nuestro resultado?
30/67
31/67
Alineamiento global: las secuencias se alinean a lo largo de toda su
longitud, intentando alinear secuencias completas
● Se introducen huecos para igualar las longitudes de secuencia
● Útil para secuencias muy parecidas y de longitud similar
Alineamiento local: sólo se alinean la partes más parecidas
de la secuencia
● Favorece encontrar patrones similares dentro de la secuencia
● Un alineamiento local es una combinación de muchos alineamientos globales
de secuencias cortas.
Siguiente paso: Alineamiento múltiple.
32/67
3.
Análisis de
componentes
principales
“Principal component analysis (PCA) is a statistical procedure that uses
an orthogonal transformation to convert a set of observations of
possibly correlated variables into a set of values of linearly
uncorrelated variables called principal components (or sometimes,
principal modes of variation)”
Definición:
34/67
Existen dos formas básicas de aplicar el ACP:
1. Método basado en la matriz de correlación, cuando los datos no
son dimensionalmente homogéneos o el orden de magnitud de las
variables aleatorias medidas no es el mismo.
2. Método basado en la matriz de covarianzas, que se usa cuando los
datos son dimensionalmente homogéneos y presentan valores
medios similares.
Formas básicas:
35/67
Caso particular: Correlación
36/67
http://setosa.io/ev/principal-component-analysis/
Drug discovery
Mathematical models can help discover new drug targets.
•Network-based modeling can reveal promising single or combinatorial drug
targets.
•Multiscale modeling can identify drug targets across different scales.
•Interdisciplinary research is necessary to advance in drug discovery.
37/67
Multitud de herramientas matemáticas
a nuestra disposición.
▶ Geometría diferencial
▶ Análisis
▶ Teoría de nudos
▶ Probabilidad y estadística
▶ Álgebra y álgebra abstracta
38/67
Informática
Bioinformática
40/67
Illumina MiSeq
41/67
¡Ups!
42/67
¿Qué recursos tenemos?
43/67
44/67
https://bioinf.comav.upv.es/courses/linux/presentacion_del_curso.html
¿Qué podemos hacer?
▶ Programar
▶ Utilizar plataformas fiables y potentes
45/67
¿Qué podemos hacer?
▶ Aprender a dar órdenes al ordenador con total libertad
▶ Utilizar plataformas fiables y potentes
46/67
Otros sistemas operativos
47/67
https://es.wikipedia.org/wiki/GNU/Linux
¿Programar?
49
50
¿Cuál?
51/67
¿Python?
53/67
¿Por qué Python?
▶ Tiene una sintaxis sencilla
▶ Viene con bibliotecas por defecto con muchas tareas comunes
▶ Es libre
▶ Es interpretado
▶ Es muy utilizado (también en la comunidad científica)
54/67
Sintaxis sencilla
Código en Python
print("Hola mundo")
Código en C
#include <stdio.h>
int main(void) {
printf("Hello, World!n");
return 0;
55/67
Consola o intérprete
56/67
https://repl.it/languages/python3
57/67
OpenSource - www.python.org
58/67
Ranking de lenguajes según IEEE en 2017
59/67
https://stackoverflow.blog/2017/09/06/incredible-growth-python/
Predicción de tráfico en stack overflow
60/67
https://stackoverflow.blog/2017/09/06/incredible-growth-python/
http://biopython.org/
61/67
Un ejemplito
62/67
dna = 'AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAA'
nt = ['A', 'C', 'G', 'T']
for n in nt:
nt_total = dna.count(n)
print('{}: {}'.format(n, nt_total))
¿Puedo tener más interactividad?
63/67
http://jupyter.org/
▶ Interactividad
▶ Más lenguajes (+40): R, Perl, Octave…
▶ Compartir notebooks
▶ Incrustar imágenes, vídeos y componentes para manipular los datos
64/67
https://try.jupyter.org/
65/67
Compartir y colaborar
66/67
Aplicación
▶ Libros
▶ Cursos
▶ Talleres
67/67
https://www.anaconda.com/distribution/
68/67
Compartir y Colaborar
Ciencia abierta
Artículo abierto sobre RNA
http://nbviewer.jupyter.org/github/maayanlab/Zika-RNAseq-Pipeline/blob/master/Zika.ipynb 70/67
Ejercicios resueltos de Rosalind
https://github.com/ciherraiz/bioinformatics/blob/master/rosalind.ipynb
71/67
¡Muchas gracias!
t.me/bioinformaticsGRX
@bioinfGRX
https://github.com/bioinformaticsGRX
bioinformaticsgrx.slack.com
(con invitación)
Dónde encontrarnos
Déjanos tu opinión: https://tinyurl.com/yc58omy7
@bioinfGRX bioinformaticsgrx@gmail.com

Más contenido relacionado

Similar a Introduccion a la BioInformatica | BioInformaticsGRX

Algoritmos geneticos
Algoritmos geneticosAlgoritmos geneticos
Algoritmos geneticos
YAn_dy
 
Software for systems biology
Software for systems biologySoftware for systems biology
Software for systems biology
Carlos Rodriguez
 
Dialnet bioinformatica unaoportunidady-undesafio-2731617
Dialnet bioinformatica unaoportunidady-undesafio-2731617Dialnet bioinformatica unaoportunidady-undesafio-2731617
Dialnet bioinformatica unaoportunidady-undesafio-2731617
Jaime Paredes
 

Similar a Introduccion a la BioInformatica | BioInformaticsGRX (20)

Informe n°01 analisis de secuencias 16 s- bq
Informe n°01   analisis de secuencias 16 s- bqInforme n°01   analisis de secuencias 16 s- bq
Informe n°01 analisis de secuencias 16 s- bq
 
Algoritmos geneticos
Algoritmos geneticosAlgoritmos geneticos
Algoritmos geneticos
 
PROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdfPROGRAMA BIOINFORMATICO MEGA DNA.pdf
PROGRAMA BIOINFORMATICO MEGA DNA.pdf
 
Informe MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdfInforme MEGA BIOTECNOLOGIA (1).pdf
Informe MEGA BIOTECNOLOGIA (1).pdf
 
Reporte práctica #3
Reporte práctica #3Reporte práctica #3
Reporte práctica #3
 
Software for systems biology
Software for systems biologySoftware for systems biology
Software for systems biology
 
Xpin algoritmos genéticos
Xpin   algoritmos genéticosXpin   algoritmos genéticos
Xpin algoritmos genéticos
 
Proteomica y bioinformatica
Proteomica y bioinformaticaProteomica y bioinformatica
Proteomica y bioinformatica
 
Ensayo "Bioinformatica"
Ensayo "Bioinformatica"Ensayo "Bioinformatica"
Ensayo "Bioinformatica"
 
Jgap algritmos geneticosss
Jgap  algritmos geneticosssJgap  algritmos geneticosss
Jgap algritmos geneticosss
 
Algoritmo Genético
Algoritmo GenéticoAlgoritmo Genético
Algoritmo Genético
 
Algoritmo Genético
Algoritmo GenéticoAlgoritmo Genético
Algoritmo Genético
 
Informe de bio filogenia
Informe de bio filogeniaInforme de bio filogenia
Informe de bio filogenia
 
Ppt0000004
Ppt0000004Ppt0000004
Ppt0000004
 
9. bioinformatica bases de datos.
9. bioinformatica bases de datos.9. bioinformatica bases de datos.
9. bioinformatica bases de datos.
 
Jorge martinez evaluacion de las estrategias de auto-monitoreo en ambientes ...
Jorge martinez  evaluacion de las estrategias de auto-monitoreo en ambientes ...Jorge martinez  evaluacion de las estrategias de auto-monitoreo en ambientes ...
Jorge martinez evaluacion de las estrategias de auto-monitoreo en ambientes ...
 
Dialnet bioinformatica unaoportunidady-undesafio-2731617
Dialnet bioinformatica unaoportunidady-undesafio-2731617Dialnet bioinformatica unaoportunidady-undesafio-2731617
Dialnet bioinformatica unaoportunidady-undesafio-2731617
 
Alineamiento de secuencias de adn, árbol fitogenético
Alineamiento de secuencias de adn, árbol fitogenéticoAlineamiento de secuencias de adn, árbol fitogenético
Alineamiento de secuencias de adn, árbol fitogenético
 
Practica 1 analisis de secuencias del gen16 s
Practica 1   analisis de secuencias del gen16 s Practica 1   analisis de secuencias del gen16 s
Practica 1 analisis de secuencias del gen16 s
 
Analisi de gen
Analisi de genAnalisi de gen
Analisi de gen
 

Último

🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 

Último (20)

Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
 

Introduccion a la BioInformatica | BioInformaticsGRX