CONSORCIO ONTOLOGÍA DE GENES: 

herramientas para anotación funcional
Mónica Muñoz-Torres | @monimunozto



For the Gene O...
EQUIPOS DE DESARROLLADORES
APOLLO DEVELOPERS 2
h " p : / / G e n e O n t o l o g y . o r g 	
  
Nathan Dunn
Suzi Lewis
Pri...
CONTENIDO

•  Hoy	
   descubriremos	
   cómo	
  
u/lizar	
   la	
   ontología	
   de	
  
genes	
   de	
   una	
   forma	
 ...
Ayer…	
  
5
El mapa del genoma
Introduction
Diseño & muestreo
Análisis comparativos
Colección
consenso
de genes
Anotación
manual
Ano...
ANOTACION DE GENOMAS

requiere precisión y profundidad
Anotaciones con Precisión 6
La	
  colección	
  de	
  genes	
  de	
 ...
7
BIOCURACION

ajustes estructurales y funcionales
Iden/ficar	
  los	
  elementos	
  del	
  genoma	
  
que	
  mejor	
  repr...
ANOTACION

un ejercicio en colaboración
COLABORANDO 8
Los	
  inves5gadores	
  usualmente	
  buscamos	
  las	
  
opiniones	...
Precisión:	
  	
  
mejorando	
  la	
  anotación	
  estructural.	
  
Apollo

una herramienta para editar anotaciones
10
v  En	
  la	
  web,	
  integrado	
  con	
  JBrowse.	
  
v  ¡Permite	
...
Profundidad:	
  	
  
anotación	
  funcional.	
  
LA ONTOLOGIA DE GENES

anotación funcional
The Gene Ontology 12
• 	
  GO	
  es	
  una	
  forma	
  de	
  capturar	
  el	
  ...
LAS ONTOLOGIAS

todos para uno…
DEMO 13
3.	
  Componente	
  Celular	
  
Donde	
  se	
  localiza	
  el	
  producto	
  de	
 ...
ANATOMIA	
  DE	
  UN	
  TERMINO	
  DE	
  GO	
  
DEMO	
   14	
  
ID	
  único	
  
Nombre	
  del	
  término	
  
Ontología	
  ...
ONTOLOGIA	
  DE	
  GENES	
  
estructura	
  
DEMO	
   15	
  
• 	
  Grafo	
  acíclico	
  dirigido	
  
-­‐	
  Un	
  término	
...
GO ANNOTATIONS 16
¿DÓNDE ESTAN LAS ANOTACIONES?
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
1.	
  Si/o	
  de	
  internet	
 ...
GO ANNOTATIONS 17
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
2.	
  Si/o	
  de	
  internet	
  de	
  UniProt-­‐GOA	
  
Los	
...
GO ANNOTATIONS 18
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
3.	
  UniProtKB	
  
Anotaciones	
  con	
  
términos	
  de	
  ...
GO ANNOTATIONS 19
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
4.	
  Ensembl	
   hTp://www.ensembl.org/	
  	
  
¿DÓNDE ESTAN...
GO ANNOTATIONS 20
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
5.	
  NCBI	
  Gene	
  
hTp://www.ncbi.nlm.nih.gov/gene/	
  	
...
GO BROWSERS 21
NAVEGADORES PARA GO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
hTp://amigo.geneontology.org/	
  	
  
Grebe:...
GO BROWSERS 22
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
Búsqueda	
  simple:	
  	
  
busca	
  términos	
  GO...
Ejercicios 23
EJERCICIO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
hTp://www.ebi.ac.uk/QuickGO/	
  	
  
Ejercicio	
  1.	
 ...
¿Porqué	
  necesitamos	
  GO?	
  
RAZONES PARA QUE EXISTA GO
Razones 25
•  Inconsistencia	
  en	
  el	
  lenguaje:	
  Inglés	
  	
  
INCONSISTENCIA EN EL LENGUAJE: INGLÉS
Razones 26
•  El	
  mismo	
  nombre	
  para	
  conceptos	
  diferentes	
  
Cell	
  
...
INCONSISTENCIA EN EL LENGUAJE: INGLÉS
Razones 27
•  Nombres	
  diferentes	
  para	
  el	
  mismo	
  concepto	
  
Eggplant	...
RAZONES PARA QUE EXISTA GO
Razones 28
•  Inconsistencia	
  en	
  el	
  lenguaje:	
  Inglés	
  
•  Creciente	
  can/dad	
  ...
CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS DISPONIBLES
Razones 29
Una	
  búsqueda	
  con	
  “DNA	
  repair”	
  genera	
  más	
...
RAZONES PARA QUE EXISTA GO
Razones 30
•  Inconsistencia	
  en	
  el	
  lenguaje:	
  Inglés	
  
•  Creciente	
  can/dad	
  ...
CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS AÚN POR VENIR
Razones 31
Expansión	
  de	
  la	
  información	
  en	
  pares	
  de	...
RAZONES PARA QUE EXISTA GO
Razones 32
•  Inconsistencia	
  en	
  el	
  lenguaje:	
  Inglés	
  
•  Creciente	
  can/dad	
  ...
OBJETIVOS DEL PROYECTO GO
Razones 33
•  Compilar	
  las	
  ontologías	
  
-­‐  Actualmente	
  hay	
  más	
  de	
  41,000	
...
Reactome	

PAMGO	
  
Anotación	
  con	
  GO	
  
UNA ANOTACION GO ES...
Anotación 36
...	
  una	
  declaración	
  que	
  dice	
  que	
  el	
  producto	
  de	
  un	
  gen:	...
INCORPORANDO ANOTACIONES
Anotación 37
Las	
  anotaciones	
  GO	
  se	
  pueden	
  incorporar	
  usando	
  dos	
  métodos:	...
1. ANOTACION ELECTRONICA
Anotación 38
1.1	
  Mapeo	
  de	
  conceptos	
  externos	
  a	
  términos	
  GO	
  
GO:0005634:	
...
1. ANOTACION ELECTRONICA
Anotación 39
1.2	
  Transferencia	
  automá/ca	
  de	
  anotaciones	
  electrónicas	
  a	
  ortól...
2. ANOTACION MANUAL (en UniProt-GOA)
Anotación 40
Anotaciones	
  específicas	
  y	
  de	
  alta	
  calidad	
  son	
  hechas...
NUMERO TOTAL DE ANOTACIONES UniProt-GOA
Anotación 41
Anotaciones	
  electrónicas	
  
Anotaciones	
  manuales*	
  
213,536,...
GO BROWSERS 42
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
Búsqueda	
  simple:	
  	
  
busca	
  términos	
  GO...
Ejercicios 43
EJERCICIO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
hTp://www.ebi.ac.uk/QuickGO/	
  	
  
Ejercicio	
  2.	
 ...
Análisis.	
  
¿PARA QUE SIRVE GO?
¿Para qué sirve la Ontología de Genes? 45
•  Acceder	
  a	
  información	
  funcional	
  de	
  product...
Enriquecimiento	
  &	
  
representación.	
  
Interpretando experimentos “ómicos” de alto rendimiento
Pruebas de representación y enriquecimiento 47
Escenarios:	
  
•  ...
“ENRIQUECIMIENTO”
Pruebas de representación y enriquecimiento 48
•  Es	
  el	
  método	
  más	
  común	
  para	
  interpre...
“ENRIQUECIMIENTO”
Pruebas de representación y enriquecimiento 49
•  U/liza	
  información	
  conocida	
  acerca	
  de	
  l...
VARIACIONES COMUNES DE ANALISIS DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 50
Para	
  tener	
  en	
  c...
CONJUNTOS DE DATOS DE ANOTACION
Pruebas de representación y enriquecimiento 51
•  Los	
  conjuntos	
  apropiados	
  depend...
DOS TIPOS PRINCIPALES DE PRUEBAS
Pruebas de representación y enriquecimiento 52
•  “Suprarepresentación	
  /	
  	
  Infrar...
PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 53
•  Entrada	
  
•  Una	
  lista	
  de	
  genes	
  d...
PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 54
Lista	
  de	
  genes	
  como	
  
referencia	
  
Tu...
PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 55
Tu	
  lista	
  de	
  genes	
  
como	
  referencia	...
PRUEBA DE REPRESENTACION
Pruebas de representación y enriquecimiento 56
Por	
  cada	
  término	
  de	
  anotación:	
  	
  ...
PRUEBA DE SUPRA / INFRA REPRESENTACIÓN
Pruebas de representación y enriquecimiento 57
Tabal	
  de	
  conUngencia	
   P-­‐v...
ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS
Pruebas de representación y enriquecimiento 58
Para	
  MODs	
  
Especie	
  
Ontolog...
ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS
Pruebas de representación y enriquecimiento 59
hTp://www.ebi.ac.uk/interpro/search/...
PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 60
•  Entrada	
  
•  Una	
  lista	
  de	
  genes	
  ...
PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 61
Tick	
  para	
  remover	
  el	
  uso	
  
de	
  pa...
PRUEBA DE ENRIQUECIMIENTO
Pruebas de representación y enriquecimiento 62
Estadís/camente	
  
compara	
  la	
  
distribució...
RESUMEN FUNCIONAL

GO slims
Term Representation, so-called “Enrichment” 63
Para	
  conjuntos	
  de	
  datos	
  de	
  larga...
ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH”
Term Representation, so-called “Enrichment” 64
Muchos	
  productos	
  de	
  g...
ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH”
Term Representation, so-called “Enrichment” 65
...	
  sin	
  embargo,	
  las	...
RESUMEN FUNCIONAL

GO slims
Term Representation, so-called “Enrichment” 66
•  Hay	
  GO	
  slims	
  personalizados	
  disp...
GO BROWSERS 67
NAVEGANDO GO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
Búsqueda	
  simple:	
  	
  
busca	
  términos	
  GO...
Ejercicios 68
EJERCICIO
hTp://www.ebi.ac.uk/GOA/downloads.html	
  
hTp://www.ebi.ac.uk/QuickGO/	
  	
  
Ejercicio	
  3.	
 ...
PRECAUCIONES AL USAR GO
Term Representation, so-called “Enrichment” 69
•  La	
  Ontología	
  de	
  Genes	
  cambia	
  cons...
PRECAUCIONES AL USAR GO
Term Representation, so-called “Enrichment” 70
•  “Unannotated”	
  no	
  significa	
  “unknown”	
  ...
Otras	
  herramientas	
  	
  
para	
  el	
  uso	
  de	
  GO.	
  
PAINT

Phylogenetic Annotation INference Tool
PAINT 72
Datos	
  
experimentales	
  
Anotaciones	
  
propagadas	
  
(azul	
...
Noctua

edición de modelos moleculares
Noctua | LEGO 73
•  Edición	
  gráfica,	
  colaboraUva	
  para	
  colecciones	
  
de...
CONTENIDO

•  ESTRUCTURA	
  DE	
  GO	
  
descripción	
  y	
  búsqueda	
  
	
  
•  ANOTACION	
  
¿Cómo	
  se	
  anota	
  co...
•  Berkeley	
  BioinformaUcs	
  Open-­‐source	
  Projects	
  (BBOP),	
  
Berkeley	
  Lab:	
  Apollo	
  and	
  Gene	
  Onto...
Próxima SlideShare
Cargando en…5
×

CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional

457 visualizaciones

Publicado el

Esta presentación contiene información impartida durante el curso de Ontología de Genes en BIOS. Los temas de la charla incluyen una descripción de la estructura de la ontología, cómo se construyen los términos y porqué es necesario usar ontologías. También discutimos los análisis estadísticos de enriquecimiento y representación de términos. Los ejercicios son parte del entrenamiento del grupo de GOA en EMBL-EBI.
La presentación fue dada en Español.

Publicado en: Ciencias
0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
457
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
10
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional

  1. 1. CONSORCIO ONTOLOGÍA DE GENES: 
 herramientas para anotación funcional Mónica Muñoz-Torres | @monimunozto
 
 For the Gene Ontology Consortium. Also at BBOP: Christopher Mungall, Seth Carbon, Heiko Dietze, Jeremy Nguyen, Nicole Washington, Nathan Dunn, and Suzanna E. Lewis (PI). 
 Berkeley Bioinformatics Open-Source Projects
 Environmental Genomics & Systems Biology Division 
 Lawrence Berkeley National Laboratory
 
 BIOS. Manizales, Colombia, 22-Sep-2015
  2. 2. EQUIPOS DE DESARROLLADORES APOLLO DEVELOPERS 2 h " p : / / G e n e O n t o l o g y . o r g   Nathan Dunn Suzi Lewis Principal Investigator BBOP   Moni Munoz-TorresChris Mungall Nicole WashingtonHeiko Dietze Seth Carbon Jeremy Nguyen ... and a few hundred of our closest friends at the GOC. UniProt-GOA team at EMBL-EBI Rachael Huntley Now at UCL Tony Swafford Maria Martin Claire O’Donovan Team Leader Paul Thomas (PI) Huaiyu Mi PANTHER DB University of Southern California
  3. 3. CONTENIDO
 •  Hoy   descubriremos   cómo   u/lizar   la   ontología   de   genes   de   una   forma   más   eficiente,   y   descubriremos   algunas   herramientas   para   su  acceso.   GENE  ONTOLOGY  CONSORTIUM   herramientas  para  anotación  funcional.   3OUTLINE
  4. 4. Ayer…  
  5. 5. 5 El mapa del genoma Introduction Diseño & muestreo Análisis comparativos Colección consenso de genes Anotación manual Anotación automatizada Secuenciación Ensamblaje Síntesis & publicación QC QC QC QC QCQC QC
  6. 6. ANOTACION DE GENOMAS
 requiere precisión y profundidad Anotaciones con Precisión 6 La  colección  de  genes  de  cada  organismo  informa  una  variedad  de  análisis:   •  Número  de  genes,  %  GC,  composición  de  TEs,  áreas  repe//vas   •  Asignar  función   •  Evolución  molecular,  conservación  de  secuencias   •  Familias  de  genes   •  Caminos  metabólicos   •  ¿Qué  hace  único  a  cada  organismo?     ¿Qué  hace  “abeja”  a  una  abeja?   Marbach et al. 2011. Nature Methods | Shutterstock.com | Alexander Wild
  7. 7. 7 BIOCURACION
 ajustes estructurales y funcionales Iden/ficar  los  elementos  del  genoma   que  mejor  representan  la  biología   subyacente  y  eliminar  los  elementos   que  reflejan  errores  sistémicos  de  los   análisis  automa/zados.   Asignar  funciones  a  través  de  análisis   compara/vos  entre  elementos   genómicos  similares  de  organismos   cercanamente  relacionados  usando   literatura,  bases  de  datos,  y  datos   experimentales.   BIOCURACION hTp://GeneOntology.org   1   2  
  8. 8. ANOTACION
 un ejercicio en colaboración COLABORANDO 8 Los  inves5gadores  usualmente  buscamos  las   opiniones  y  percepciones  de  colegas  con   experiencia  en  áreas  específicas  del   conocimiento.     Por  ejemplo,  dominios  conservados     o  familias  de  genes.  
  9. 9. Precisión:     mejorando  la  anotación  estructural.  
  10. 10. Apollo
 una herramienta para editar anotaciones 10 v  En  la  web,  integrado  con  JBrowse.   v  ¡Permite  la  colaboración  en  /empo  real!   v  Automá/camente  genera  datos  en     formatos  comunes  para  análisis.   v  Anotación  de  genes,  pseudogenes,  tRNAs,     snRNAs,  snoRNAs,  ncRNAs,  miRNAs,  TEs,  y  fragmentos  repe//vos.   v  Funciones  intui/vas  y  menús  desplegables  crean  y  editan  estructuras   de  transcritos  y  exones,  insertan  comentarios  (CV,  texto  libre),  y   términos  de  GO,  etc.   INTRODUCING APOLLO hTp://GenomeArchitect.org/  
  11. 11. Profundidad:     anotación  funcional.  
  12. 12. LA ONTOLOGIA DE GENES
 anotación funcional The Gene Ontology 12 •   GO  es  una  forma  de  capturar  el   conocimiento  biológico  para   productos  de  genes  individuales  de   forma  computable,  usando   ontologías.     •   Es  un  grupo  de  conceptos,  y  las   relaciones  entre  ellos,  arreglados   como  una  jerarquía  (no  linear).     •   GOC  genera  recursos  que  puedan   ser  usados  para  asignar  funciones  a   los  genes  de  interés,  usando  GO.   Conceptos  menos  específicos   Conceptos  más  específicos  
  13. 13. LAS ONTOLOGIAS
 todos para uno… DEMO 13 3.  Componente  Celular   Donde  se  localiza  el  producto  de  gen   •   mitocondria     •   matriz  mitocondrial   •   membrana  interna          mitocondrial   1.  Función  Molecular   Una  ac/vidad,  tarea,     o  trabajo  elementales   •   Ac/vidad  de  proteína   quinasa   • Ac/vidad  de  receptor  de   insulina   2.  Proceso  Biológico   Una  serie  de  eventos   comúnmente  reconocidos   •   División  celular   Mitochondrion. PaisekaScience Photo Library Insulin Receptor Petrus et al, 2009, ChemMedChem| End of Telophase. Lothar Schermelleh
  14. 14. ANATOMIA  DE  UN  TERMINO  DE  GO   DEMO   14   ID  único   Nombre  del  término   Ontología   Sinónimo   Definición   Información  relacionada   con  el  término.  
  15. 15. ONTOLOGIA  DE  GENES   estructura   DEMO   15   •   Grafo  acíclico  dirigido   -­‐  Un  término  puede  tener  más  de  un  “parental”   •   Los  términos  están  unidos  por  relaciones   is_a        es_un   part_of      parte_de   regulates  (&  +/-­‐)  regula  (&+/-­‐)   occurs_in    ocurre_en   has_part      5ene_parte   Estas  relaciones  permiten  análisis  complejos  de  conjuntos  de  datos  de  gran  envergadura   -­‐  Un  término  puede  tener  más  de  un  “hijo”  
  16. 16. GO ANNOTATIONS 16 ¿DÓNDE ESTAN LAS ANOTACIONES? hTp://www.ebi.ac.uk/GOA/downloads.html   1.  Si/o  de  internet  del  Consorcio  de  GO   Los  archivos  de  anotación  guardan   información  acerca  de  cada   asociación  entre  un  producto     de  gen  y  un  término.     Archivo  de   anotación  por   cada  especie.   hTp://GeneOntology.org/    
  17. 17. GO ANNOTATIONS 17 hTp://www.ebi.ac.uk/GOA/downloads.html   2.  Si/o  de  internet  de  UniProt-­‐GOA   Los  archivos  de  anotación  guardan   información  acerca  de  cada   asociación  entre  un  producto     de  gen  y  un  término.     Archivo  de   anotación  por   cada  especie.   hTp://www.ebi.ac.uk/GOA     ¿DÓNDE ESTAN LAS ANOTACIONES?
  18. 18. GO ANNOTATIONS 18 hTp://www.ebi.ac.uk/GOA/downloads.html   3.  UniProtKB   Anotaciones  con   términos  de  GO  para   cada  producto  de  gen.   hTp://www.uniprot.org/uniprot/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  19. 19. GO ANNOTATIONS 19 hTp://www.ebi.ac.uk/GOA/downloads.html   4.  Ensembl   hTp://www.ensembl.org/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  20. 20. GO ANNOTATIONS 20 hTp://www.ebi.ac.uk/GOA/downloads.html   5.  NCBI  Gene   hTp://www.ncbi.nlm.nih.gov/gene/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  21. 21. GO BROWSERS 21 NAVEGADORES PARA GO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://amigo.geneontology.org/     Grebe:  interface  de  asistencia   para  AmiGO2  con  opción  para   “llenar  el  espacio  en  blanco”.   GOOSE:  interrogar  la   base  de  datos  de  GO   usando  SQL.   Servicio  de  análisis  de   representación  de   términos.   Generado  por  PANTHER   Búsqueda  simple:  con   auto-­‐completar.  
  22. 22. GO BROWSERS 22 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  23. 23. Ejercicios 23 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  1.   Buscando  un  término  GO.   Ejercicio  1  en  página  15.  
  24. 24. ¿Porqué  necesitamos  GO?  
  25. 25. RAZONES PARA QUE EXISTA GO Razones 25 •  Inconsistencia  en  el  lenguaje:  Inglés    
  26. 26. INCONSISTENCIA EN EL LENGUAJE: INGLÉS Razones 26 •  El  mismo  nombre  para  conceptos  diferentes   Cell   o   ???   www.robertpaterson.com www.biology.usf.edu
  27. 27. INCONSISTENCIA EN EL LENGUAJE: INGLÉS Razones 27 •  Nombres  diferentes  para  el  mismo  concepto   Eggplant   Lo  mismo  es  cierto  cuando  se  trata  de  conceptos  biológicos:   •  Esto  dificulta  las  comparaciones,  par/cularmente  cuando  se   comparan  especies  o  bases  de  datos.   Aubergine   Brinjal   Melongene   www.care2.com
  28. 28. RAZONES PARA QUE EXISTA GO Razones 28 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles  
  29. 29. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS DISPONIBLES Razones 29 Una  búsqueda  con  “DNA  repair”  genera  más  de  80,000  resultados.   hTp://www.ncbi.nlm.nih.gov/pubmed/    
  30. 30. RAZONES PARA QUE EXISTA GO Razones 30 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles   •  Creciente  can/dad  de  datos  biológicos  aún  por   venir  
  31. 31. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS AÚN POR VENIR Razones 31 Expansión  de  la  información  en  pares  de  bases.   http://www.ncbi.nlm.nih.gov/
  32. 32. RAZONES PARA QUE EXISTA GO Razones 32 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles   •  Creciente  can/dad  de  datos  biológicos  que  aún   están  por  venir   •  Conjuntos  de  datos  enormes  necesitan  ser   interpretados  rápidamente    
  33. 33. OBJETIVOS DEL PROYECTO GO Razones 33 •  Compilar  las  ontologías   -­‐  Actualmente  hay  más  de  41,000  términos   -­‐  Aumentando  y  mejorando  constantemente   •  Anotar  productos  de  genes  usando  términos  de  ontología   -­‐  Unos  30  grupos  contribuyen  anotaciones   •  Proveer  un  recurso  público  de  datos  y  herramientas   -­‐  Lanzamientos  regulares  de  archivos  con  anotaciones   -­‐  Herramientas  para  navegar  e  interrogar  las  anotaciones  y   también  para  editar  las  anotaciones.  
  34. 34. Reactome PAMGO  
  35. 35. Anotación  con  GO  
  36. 36. UNA ANOTACION GO ES... Anotación 36 ...  una  declaración  que  dice  que  el  producto  de  un  gen:     1.  /ene  una  función  molecular  par/cular     o,  está  involucrado  en  un  proceso  biológico   o,  está  localizado  en  cierto  componente  celular     2.  lo  que  ha  sido  determinado  por  un  método  par/cular     3.  y  ha  sido  descrito  en  una  referencia  en  especial  
  37. 37. INCORPORANDO ANOTACIONES Anotación 37 Las  anotaciones  GO  se  pueden  incorporar  usando  dos  métodos:   1.  Anotación  Electrónica   •  Una  forma  rápida  de  producir  un  gran  número  de   anotaciones   •  Las  anotaciones  usan  términos  GO  menos  específicos   •  La  única  fuente  de  anotación  para  muchos  de  los   organismos  no  modelo  (non-­‐MODs).   2.  Anotación  Manual   •  Este  proceso  toma  /empo  y  produce  un  menor   número  de  anotaciones   •  Las  anotaciones  /enden  a  usar  términos  GO   muy  específicos  
  38. 38. 1. ANOTACION ELECTRONICA Anotación 38 1.1  Mapeo  de  conceptos  externos  a  términos  GO   GO:0005634:  Nucleus   GO:0004707:  MAP  kinase  ac/vity   GO:0009734:  Auxin-­‐ac/vated  signaling  pathway  
  39. 39. 1. ANOTACION ELECTRONICA Anotación 39 1.2  Transferencia  automá/ca  de  anotaciones  electrónicas  a  ortólogos   e.g.  Humano   Macaco   Ratón   Chimpancé   Vaca   Cuy   Ratón   Rata   Pollo   ...  y  otros  más   Ensembl  compara   hTp://www.geneontology.org/cgi-­‐bin/references.cgi     Arabidopsis   Rice   Alamo   Maíz   Braquiaria   Uva   ...  y  otros  más   Ensembl  compara   Las  anotaciones  son  de  alta  calidad  e  incluyen  una  explicación  del  método  u/lizado  (ver  GO_REF)  
  40. 40. 2. ANOTACION MANUAL (en UniProt-GOA) Anotación 40 Anotaciones  específicas  y  de  alta  calidad  son  hechas  usando:       •  Aryculos  completos,  revisados  por  expertos   •  Un  rango  de  códigos  de  evidencia  (“evidence  codes”)  para   categorizar  los  /pos  de  evidencia  que  se  encuentran  en  un   aryculo.     E.g.  IDA,  IMP,  IPI  
  41. 41. NUMERO TOTAL DE ANOTACIONES UniProt-GOA Anotación 41 Anotaciones  electrónicas   Anotaciones  manuales*   213,536,891   2,865,245   31,499,149   432,005   Número  de  diferentes   productos  de  gen   *Incluye  anotaciones  manuales  integradas  de   grupos  externos  MOD  y  grupos  especializados.  
  42. 42. GO BROWSERS 42 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  43. 43. Ejercicios 43 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  2.     Encuentra  anotaciones  para  una  proteína.  Ejercicio  2,   página  15.     Encuentra  anotaciones  para  una  lista  de  proteínas.   Ejercicios  1  y  2  pg.  20.  
  44. 44. Análisis.  
  45. 45. ¿PARA QUE SIRVE GO? ¿Para qué sirve la Ontología de Genes? 45 •  Acceder  a  información  funcional  de  productos  de  genes   •  Analizar  datos  genómicos  o  proteómicos  de  alto  rendimiento   •  Validación  de  técnicas  experimentales   •  Obtener  una  visión  general  de  las  funciones  de  un  proteoma   •  Obtener  información  funcional  para  nuevos  productos  de  genes   •  Etc…   Dutkowski et al 2013, Nature Biotechnology.
  46. 46. Enriquecimiento  &   representación.  
  47. 47. Interpretando experimentos “ómicos” de alto rendimiento Pruebas de representación y enriquecimiento 47 Escenarios:   •  Cuando  /enes  un  experimento  con  datos  de  todo  el  genoma,  e.g.:   •  Estudio  de  asociación  de  enfermedad  con  >100M  si/os  de   variantes  genómicas  diferentes   •  Experimento  de  RNA-­‐seq  que  cuan/fica  los  cambios  en  decenas   de  miles  de  genes  o  de  isoformos.   •  Etc.  
  48. 48. “ENRIQUECIMIENTO” Pruebas de representación y enriquecimiento 48 •  Es  el  método  más  común  para  interpretar  un  gran  número  de  medidas   individuales,  en  términos  de  la  biología  subyacente.   •  Determina  cuáles  términos  de  GO  están  más  comúnmente  asociados  con   una  lista  específica  de  genes  /  proteínas,  cuando  se  compara  con  una  lista   control  o  con  el  resto  del  genoma.     •  Conocido  en  inglés  como  “enrichment  analysis”  o  “pathway  analysis”.  
  49. 49. “ENRIQUECIMIENTO” Pruebas de representación y enriquecimiento 49 •  U/liza  información  conocida  acerca  de  la  función  de  un  gen  para  ver  si   hay  alguna  tendencia  estadís/ca  en  los  /pos  de  FUNCIONES  de  los   genes  muestran  cambios  en  el  experimento.     •  Hipótesis  de  trabajo:     •  Los  genes  el  en  mismo  subsistema  biológico  (“módulo”  o  “camino”)   /enden  a  estar  regulados  de  forma  coordinada,  o  a  tener  efectos   biológicos  similares  cuando  son  perturbados.  
  50. 50. VARIACIONES COMUNES DE ANALISIS DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 50 Para  tener  en  cuenta:   •  Diferentes  pruebas  estadís/cas  requieren  diferentes  conjuntos  de  datos.     •  Hay  diferentes  “conjuntos  de  datos  de  anotación”  (“annota/on  sets”).   •  Si  se  observan  diferencias  en  los  resultados,  no  escoja  la  respuesta   que  más  le  gustaría  que  fuera  cierta,  sino  examine  los  resultados  para   entenderlos  bien.  
  51. 51. CONJUNTOS DE DATOS DE ANOTACION Pruebas de representación y enriquecimiento 51 •  Los  conjuntos  apropiados  dependen  de  la  pregunta  biológica   •  El  obje/vo  de  la  mayoría  de  análisis  de  datos  “ómicos”  es  iden/ficar   cambios  correlacionados  entre  grupos  de  genes  que  posiblemente   funcionan  juntos:  procesos  biológicos  de  GO  (incluyendo  caminos  /   pathways).   •  Los  análisis  de  enriquecimiento  iden/fican  diferentes  aspectos  de  la   ontología  de  genes.   •  Función  molecular,  componente  celular,  proceso  biológicos   •  Hay  diferentes  versiones  del  mismo  conjunto  de  datos:   •  Siempre  haz  uso  de  los  conjuntos  de  datos  más  recientes:  los  más   completos,  los  más  acertados.   •  Con  GO,  puedes  restringirte  a  un  subconjunto  de  /pos  de  evidencia  
  52. 52. DOS TIPOS PRINCIPALES DE PRUEBAS Pruebas de representación y enriquecimiento 52 •  “Suprarepresentación  /    Infrarepresentación”   •  ¿Considerando  mi  lista  de  genes,  hay  alguna(s)  clase(s)  funcional(es)  que   se  encuentre(n)  representada(s)  más  /  menos  frecuentemente  de  lo   esperado?     •  “Enriquecimiento”    (e.g.  Gene  Set  Enrichment  Analysis  (GSEA))   •  No  hay  una  lista.  En  cambio,  para  cada  gen  en  el  experimento  se  mide  y  se   computa  un  valor.   •  ¿Tienen  los  genes  de  una  clase  funcional  en  par5cular  una  distribución  de   valores  que  es  diferente  de  la  esperada?  
  53. 53. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 53 •  Entrada   •  Una  lista  de  genes  de  interés.   •  Opcional,  pero  recomendado:  una  lista  de  referencia  de  genes  de  la  cuál   se  sacaron  los  genes  de  la  primera  lista.     ¿Se  ven  algunas  de  las  clases  funcionales  supra  (o  infra)  representadas  en   la  lista  comparada  con  lo  esperado  por  azar?     •  Salida       •  Enriquecimiento  /  disminución:  ¿Cuántos  más  (menos)  genes  de  cada   clase  hay  en  la  lista,  comparado  con  lo  esperado?   •  P-­‐value:  probabilidad  que  el  enriquecimiento  /  disminución  observado(a)   sea  significa/vamente  diferente  de  la  hipótesis  nula  de   NO  ENRIQUECIMIENTO  /  DISMINUCIÓN.  
  54. 54. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 54 Lista  de  genes  como   referencia   Tu  lista  de  genes  de   interés   Es  necesario  definir:   •  Lista(s)  de  genes  de  interés   •  Lista  de  genes  como  referencia   EJEMPLO  1  
  55. 55. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 55 Tu  lista  de  genes   como  referencia   Lista  de  genes   de  interés   Genes  anotados  con  un  término  GO   Genes  no  anotados  con  un  término  GO   ¿Está  la  clase  de  anotación  supra  o  infra   representada,  comparada  con  la  referencia?     EJEMPLO  1  
  56. 56. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 56 Por  cada  término  de  anotación:     ¿Hay  más  (supra)  o  menos  (infra)  genes  representados  en  la  lista  de   interés,  comparados  con  lo  esperado  por  azar?   EJEMPLO  2  
  57. 57. PRUEBA DE SUPRA / INFRA REPRESENTACIÓN Pruebas de representación y enriquecimiento 57 Tabal  de  conUngencia   P-­‐value   Conteo  de  genes  con   término  GO  en  el   conjunto  de  datos   Conteo  de  genes  sin   término  GO  en  el   conjunto  de  datos   Conteo  en  el  conjunto     (e.g.  genes  expresados   diferencialmente)     Conteo  en  conjunto  de   referencia  (e.g.  todos  los   genes  en  el  arreglo)     Test  exacto  de  Fisher   o  prueba  chi-­‐cuadrado   o  Bionomial   o  hipergeométrico   51   125   173   416   8588   9004   467   8713   9177   8  x  10-­‐52   EJEMPLO  2  
  58. 58. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS Pruebas de representación y enriquecimiento 58 Para  MODs   Especie   Ontología   Corrección   Fuente  de  datos,   visualización.   Powered  by   h"p://www.pantherdb.org/   hTp://GeneOntology.org/     hTp://amigo.geneontology.org/     hTp://geneontology.org/page/go-­‐enrichment-­‐analysis    
  59. 59. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS Pruebas de representación y enriquecimiento 59 hTp://www.ebi.ac.uk/interpro/search/sequence-­‐search     •  InterProScan   -­‐  Predice  términos  de  GO  basado  en   dominios  detectados  usando  nuestro   archivo  de  mapeo  InterPro-­‐2-­‐GO,  una   secuencia  a  la  vez.   hTp://geneontology.org/page/download-­‐mappings     -­‐  Descarga  e  instala  la  úl/ma  versión   de  InterProScan   Si  no  trabajas  con  MODs  
  60. 60. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 60 •  Entrada   •  Una  lista  de  genes  (tantos  como  sea  posible  para  obtener  buen  soporte   estadís/co!)  y  un  valor  cuan/ta/vo  para  cada  gen  (e.g.  medida  de   aumento  de  cambio,  “fold  change”).     •  Salida       •  La  probabilidad  que  la  distribución  de  los  valores  para  los  genes  en  cada   clase  de  GO  es  significa/vamente  diferente  de  la  distribución  de  valores   para  todos  los  genes.  
  61. 61. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 61 Tick  para  remover  el  uso   de  parámetros  por  defecto   h"p://www.pantherdb.org/  
  62. 62. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 62 Estadís/camente   compara  la   distribución  de  los   valores  para  todos   los  genes  en  cada   clase  de  anotación,   con  la  distribución   de  valores  para   todos  los  genes  en  el   experimento.   Enriquecimiento  en  un  conjunto  de  genes  -­‐     Gene  set  enrichment  (GSEA)  
  63. 63. RESUMEN FUNCIONAL
 GO slims Term Representation, so-called “Enrichment” 63 Para  conjuntos  de  datos  de  larga  envergadura:   •  Muchas  herramientas  de  análisis  de  GO  u/lizan  GO  slims  para  ofrecer  un   resumen  general  de  los  datos.   •   GO  slims  son  versiones  recortadas  de  GO  y  con/enen  un  subconjunto  de   los  términos  de  la  ontología  completa.     •   Usualmente  los  GO  slims  con/enen  términos  GO  menos  especializados  
  64. 64. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH” Term Representation, so-called “Enrichment” 64 Muchos  productos  de  genes  están  asociados  con   un  gran  número  de  nodos  finales  (leaf  nodes)  de   GO,  que  son  descrip/vos  en  detalle.  
  65. 65. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH” Term Representation, so-called “Enrichment” 65 ...  sin  embargo,  las  anotaciones  pueden  ser   mapeadas  a  conjuntos  más  pequeños  de  términos   de  GO:      
  66. 66. RESUMEN FUNCIONAL
 GO slims Term Representation, so-called “Enrichment” 66 •  Hay  GO  slims  personalizados  disponibles  para  especies  y  grupos  de  cierto   enfoque  en  hTp://geneontology.org/page/go-­‐slim-­‐and-­‐subset-­‐guide     •  Puedes  generar  tu  propio  GO  slim  usando  las  siguientes  herramientas:   •  hTp://www.ebi.ac.uk/QuickGO       •  hTp://go.princeton.edu/  
  67. 67. GO BROWSERS 67 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  68. 68. Ejercicios 68 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  3.     Uso  de  GO  slims  en  QuickGO.  Ejercicio  1,  página  27.  
  69. 69. PRECAUCIONES AL USAR GO Term Representation, so-called “Enrichment” 69 •  La  Ontología  de  Genes  cambia  constantemente  y  nuevas  anotaciones  son   creadas  con/nuamente:     •  ¡Siempre  usa  las  versiones  más  actualizadas  de  ambas!   •  Cuando  publiques  tus  análisis,  cita  al  GOC:   hTp://geneontology.org/page/go-­‐cita/on-­‐policy     •  Es  recomendable  remover  anotaciones  “NOT”  antes  de  conducir  análisis.   •  ~7K  /  141M  son  “NOT”   •  Pueden  causar  confusión  en  el  análisis  
  70. 70. PRECAUCIONES AL USAR GO Term Representation, so-called “Enrichment” 70 •  “Unannotated”  no  significa  “unknown”   •  Cuando  no  hay  evidencia  en  la  literatura  acerca  de  un  proceso,  función  o   localización,  el  producto  de  gen  se  anota  al  nodo  raíz  apropiado  en  la   ontología  con  un  código  de  evidencia  “ND”  (no  biological  data),  dis/nguiendo   así  entre  “unannotated”  y  “unknown”.   •  Pon  atención  a  la  infrarepresentación  de  términos  GO   •  Una  infrarepresentación  muy  notoria  para  un  camino  metabólico  puede   representar  que  es  necesario  tener  una  función  normal  de  este  camino  para  la   condición  específica  bajo  estudio.    
  71. 71. Otras  herramientas     para  el  uso  de  GO.  
  72. 72. PAINT
 Phylogenetic Annotation INference Tool PAINT 72 Datos   experimentales   Anotaciones   propagadas   (azul  oscuro)   PAINT   Propagación  de  anotaciones   basado  en  árboles   filogené/cos  construidos  con   familias  de  genes.  Trabaja   sobre  los  principios   evolu/vos  de  ancestro   común  y  divergencia.  
  73. 73. Noctua
 edición de modelos moleculares Noctua | LEGO 73 •  Edición  gráfica,  colaboraUva  para  colecciones   de  anotaciones  GO:  modelos  ‘LEGO’.   •  Los  usuarios  pueden  mover  y  adicionar   elementos.   •  Cada  nódulo  (caja)  es  una  función  o  proceso.   •  Todos  los  modelos  se  guardan  en  OWL  en   GitHub  (repo)  y  son  sincronizados  por  un   servidor  llamado  Minerva.   •  Se  puede  decir  mucho  más  en  un  modelo   LEGO  con  menos  esfuerzo  y  /empo  inver/do.  
  74. 74. CONTENIDO
 •  ESTRUCTURA  DE  GO   descripción  y  búsqueda     •  ANOTACION   ¿Cómo  se  anota  con  GO?     •  ANALISIS   Usos  de  GO   •  OTRAS  HERRAMIENTAS   PAINT  &  Noctua     CONSORCIO  ONTOLOGÍA  DE  GENES:     herramientas  para  anotación  funcional   74OUTLINE
  75. 75. •  Berkeley  BioinformaUcs  Open-­‐source  Projects  (BBOP),   Berkeley  Lab:  Apollo  and  Gene  Ontology  teams.  Suzanna   E.  Lewis  (PI).   •  The  members  of  the  Gene  Ontology  Consor/um.   •  Rachael  Huntley  &  Paul  Thomas  for  teaching  materials.   •  GO  is  supported  by  NIH  (NHGRI)  grant   5U41HG002273-­‐14  and  by  the  Director,  Office  of   Science,  Office  of  Basic  Energy  Sciences,  of  the  U.S.   Department  of  Energy  under  Contract  No.  DE-­‐ AC02-­‐05CH11231   •          •  For  your  a"enUon,  thank  you!   Thank you. 75 Suzanna  Lewis  (PI)   Chris  Mungall   Seth  Carbon   Heiko  Dietze   Jeremy  Nguyen   Nicole  Washington   Nathan  Dunn   Mis  colegas  en  BBOP   GO:  hTp://GeneOntology.org   ¡Gracias!  

×