SlideShare una empresa de Scribd logo
1 de 35
Descargar para leer sin conexión
Aplicación de la Web
        Semántica en
       Bioinformática
       http://mikeleganaaranguren.com/



            Mikel Egaña Aranguren
      mikel.egana.aranguren@gmail.com

         School of Computer Science
 
          University of Manchester
                       
El problema ...




    ?



                
... la solución




    ?

    ¡Web Semántica!
                
Bioinformática actual


    La Web Semántica


    Implantación de la Web
    Semántica en la
    bioinformática actual

                   
Bioinformática actual:
        información vs
         conocimiento



               
De la biología molecular a la bioinformática

 Datos
 Secuencias, estructuras, microarrays ...

                 Información
                 Anotaciones: función, interacciones, localización celular,
                 relaciones evolutivas, ...


“Conocimiento”
¿Cuál es la función y la localización
de los ortólogos provenientes de A. thaliana de mi proteina?


                             Datos




                                   Información


                                     “Conocimiento”

                                             
Problemas de la bioinformática actual

 Miller CJ, Attwood TK. Bioinformatics goes back to the future.
 Nat Rev Mol Cell Biol. 2003 Feb;4(2):157-62.

                        Exceso de información



Preguntar vs navegar                                   Ayuda para manejarla




Q708Y0: ¿Localización celular?,
¿Función?, ¿Ortólogos?, ¿?, ...




                    De recurso en recurso, no se puede “preguntar”

                    No se pueden combinar diferentes “preguntas”

                                          
Anotaciones




          
Anotaciones




          
La Web Semántica




            
Web actual




          
Web actual




                             bla bla bla
                             bla bla bla
                            bla gato bla
                             bla bla bla
                             bla bla bla




             bla gato bla
              bla bla bla
              bla bla bla
              bla bla bla
              bla bla bla



          
Web actual




                 Gato




        Persa



           
Web Semántica: metadatos y ontologías
                                                                                    Ontología
                                      Ontología
                                                                           Maquinaria
 “buscador semántico”:                                                     taller
 gato (animal!)                                       Animal


                                                           es_un
                                                                                  Metadato

                                                  Felis silvestris
                                                       catus

              bla bla bla
              bla bla bla                                       Metadato
                                                                               bla bla bla
             bla gato bla           Metadato                                   bla bla bla
              bla bla bla                                                     bla gato bla
              bla bla bla                                                      bla bla bla
                                                            bla bla bla
                                                            bla bla bla        bla bla bla
                                                           bla persa bla
                                                            bla bla bla
                                                            bla bla bla


La Red semántica. Berners-Lee, Tim; Hendler, James y
Lassila, Ora. Investigación y Ciencia: 298 - JULIO  2001
     
Web Semántica

Web Semántica            web de “conceptos” (vs docs)          “preguntas”

     “Necesito buscar gatos negros que hayan residido sus dos
     primeros años en un centro de acogida dirigido por un equipo
     internacional, cerca de mi residencia”



World Wide Web Consortium (W3C): http://www.w3.org/

    W3C Semantic Web Activity:
    http://www.w3.org/2001/sw/

    Resource Description Framework (RDF):
    Representar datos
    http://www.w3.org/RDF/

    Web Ontology Language (OWL):
    Representar conocimiento sobre
    esos datos en ontologías
    http://www.w3.org/2004/OWL/
                                         
¿Qué es una ontología?
                                  [filosofía] disciplina que describe lo existente.
ONTOLOGIA
                                  [informática] conceptos + relaciones.
CONTENIDO SEMANTICO                                           procesable por un
                                                              ordenador (indep.
conceptos + relaciones              estructura                nombres relaciones +
                                                              conceptos): Reasoning
                       formalismo


                Organismo


                     es_un
                Animal


       es_un             es_un



  Felis silvestris       Athene noctua
       catus

                                                  
¿Qué es una ontología?


                             Animal
             es_un                      es_un

    Animal                               Animal
    diurno                               nocturno


                                                es_un


                                     Felis silvestris   Caza
                                     catus                     Mus
                                                               musculus
                     es_un
                                              Caza

                 Athene noctua




                                  
Funciones de una ontología

Representación computacional
de conceptos + relaciones


                                      Integración de recursos
                                      Vocabulario común



                                     Almacenar conocimiento (KB)
                                     Combinar/integrar conocimiento




                                   “Preguntas” sobre el conocimiento
     Reasoning                     Generación de hipótesis
                                   Consistencia
                                   Inferir conocimiento no evidente
                                   ...


                                
¿Qué es una ontología?
Se crean usando un lenguaje de representación de conocimiento: OWL, ...
Se “encarnan” en archivos.




                                          
¿Qué es una ontología?
Se manipulan con programas: Protégé, OBOEdit, ...




“Reasoners”: Pellet, FaCT++, Racer, ...




                                           
Implantación de la
    Web Semántica en
     la bioinformática
           actual


              
Web Semántica en bioinformática

Tecnología semántica                    Bioinformática:
(OWL, RDF, ...)                         - Mucha información.
                                        - Muy compleja.
                                        - Muchos científicos creando metadatos.




             Matrimonio perfecto:
             - Bioinformáticos: explotar conocimiento.
             - Investigadores productores de tecnología
               semántica: casos de uso reales, requerimientos ...




                        Bio-ontologías
                                    
Web Semántica en bioinformática

    W3C Semantic Web Health Care and Life Sciences Interest Group:
    http://www.w3.org/2001/sw/hcls/



    Good BM, Wilkinson MD.The Life Sciences Semantic Web is full of creeps!
    Brief Bioinform. 2006 Sep;7(3):275-86.



    Olivier Bodenreider, Robert Stevens.Bio-ontologies: current trends and
    future directions. Brief Bioinform, 7(3):256–274, 2006.



    Xiaoshu Wang, Robert Gorlitsky, Jonas S Almeida. From XML to RDF: how
    semantic web technologies will change the design of omic standards.
    Nat Biotechnol. 2005 Sep;23(9):1099-103.




                                          
Web Semántica en bioinformática

    OBO: Open Biomedical Ontologies (http://obofoundry.org/)
    Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K,
    The OBO Foundry: coordinated evolution of ontologies to
    support biomedical data integration.Nat Biotechnol. 2007 Nov;
    25(11):1251-5.




                                          
Web Semántica en bioinformática


    Gene Ontology (GO):
    http://www.geneontology.org/

    The Gene Ontology Consortium. Gene Ontology: tool for the
    unification of biology. Nature Genet. (2000) 25: 25-29




                                 Proceso biológico
    Vocabulario controlado       Función molecular       “Gen” (Gene Product)

                                 Localización celular


    Cierta structura: is_a, part_of, regulates.




                                            
Web Semántica en bioinformática
                           Gene Ontology
Explotar la estructura                               Integración de recursos




                                                                        Base de datos
                                                                        Q708YF

                                                                        Base de datos
                                                                        Q708YF
                                                                        Q8M34J
   Q708Y0
                                                                       Base de datos
                                                                       CYC4;D


  Ontological analysis of gene expression data: current tools, limitations, and
  open problems.Bioinformatics. 2005 Sep 15;21(18):3587-95. Epub 2005
  Jun 30.
                                           
Web Semántica en bioinformática


    EXITO DE GENE ONTOLOGY
    Michael Bada, Robert Stevens, Carole Goble, Yolanda Gil, Michael Ashburner,
    Judith A. Blake, J. Michael Cherry, Midori Harris, and Suzanna Lewis.
    A Short Study on the Success of the Gene Ontology . Web Semantics Science,
    Services and Agents on the World Wide Web, 1(2):235–240, 2004.


    PROBLEMAS DE GENE ONTOLOGY
    Solo is_a, part_of, regulates, no muy expresivo.

    OBO format (sin modelo semántico) vs RDF/OWL:
       Mikel Egaña Aranguren, Sean Bechhofer, Phillip Lord, Ulrike Sattler,
       Robert Stevens. Understanding and using the meaning of statements
       in a bio-ontology: recasting the Gene Ontology in OWL.
       BMC Bioinformatics 2007, 8:57.

    No usa reasoning:
       Mikel Egaña Aranguren, Chris Wroe, Carole Goble, Robert Stevens.
       In situ migration of handcrafted ontologies to Reason-able Forms.
       Data & Knowledge Engineering, in press.
                                              
Web Semántica en bioinformática

     EL DIVORCIO


                                                   Test
    “Informáticos”              OWL                                Biólogos
                                              Conocimiento
                                              biológico




                                                      Test
       “Biólogos”               OBO (?~OWL)                       Biólogos
                                                  Conocimiento
                                                  biológico



     Carole Goble and Chris Wroe. The Montagues and the Capulets.
     Comparative and Functional Genomics. Volume 5 (2004), Issue 8, Pages
     623-632
                                        
Web Semántica en bioinformática

    Cell Cycle Ontology (CCO)
    http://www.cellcycleontology.org/




                               
Web Semántica en bioinformática

    Cell Cycle Ontology (CCO) 


    Ontology Design Patterns for bio-ontologies: a case study on the Cell
    Cycle Ontology. Mikel Egaña Aranguren, Erick Antezana, Martin Kuiper,
    Robert Stevens. BMC bioinformatics 2008, 9(Suppl 5):S1.


    Transforming the Axiomisation of Ontologies: The Ontology Pre-Processor
    Language. M. Egaña; R. Stevens; E. Antezana. OWLED 2008, Fourth
    International Workshop - Washington, DC, USA.


    ONTO-PERL: An API supporting the development and analysis of bio-
    ontologies. E. Antezana; M. Egana; B. De Baets; M. Kuiper; V. Mironov.
    Bioinformatics 2008 24: 885-887; doi:10.1093/bioinformatics/btn042


    A cell-cycle knowledge integration framework.E. Antezana; E. Tsiporkova;
    V. Mironov; and Kuiper, M.DILS 2006, LNBI 4075, pp. 19-34, 2006.
                                         
Web Semántica en bioinformática
Cell Cycle Ontology (CCO)


Enriquecimiento por integración                      Enriquecimiento axiomático
                                      OBO
                                      OWL                             OWL
 GO (Cell Cycle)                  CCO RDF
                                      XML
 GOA                                  DOT
                                      GML
                                      XML (visANT)
                   UniProt                                    ODPs
                   IntAct
                   ...



             OBO: BioPortal, OLS, OBO-Edit
             OWL: Protégé, Ontology Server, reasoner OWL: Protégé, Ontology
             RDF: SPARQL (Virtuoso)                  Server, reasoner
             DOT: GraphViz
             GML: Cytoscape
                                        
Problemas de la Web Semántica en bioinformática

     FRUSTRACIÓN POR ...

     ... PERCEPCIÓN DEMASIADO POSITIVA DE LA TECNOLOGÍA
     Con meter todo en una ontología no es suficiente: hay que añadir axiomas,
     que es lo difícil.

     El reasoner no es el genio de la lámpara.

     Las ontologías no sirven para todo.

     “Semantics” buzz word.

     ... PERCEPCIÓN DEMASIADO NEGATIVA DE LA TECNOLOGÍA
     OWL es difícil de entender y no muy intuitivo (Unique Name Assumption,
     Open World Assumption).

     Es difícil crear una buena ontología: es difícil ver los beneficios a corto plazo.

     Tecnología todavía experimental:
         los reasoners fallan en cosas incomprensibles.
                                           
         trabajar con ontologías muy grandes es casi imposible.
Problemas de la Web Semántica en bioinformática

     FALTA:

     Mano de obra: biólogos que conozcan el dominio (¡CCO!).

     Identificadores únicos para entidades:
              LSID: http://lsids.sourceforge.net/
              URI: http://www.w3.org/2001/sw/hcls/notes/uris/

     Herramientas más “user friendly” para crear ontologías o introducir contenido
            semántico en páginas web.

     Explicación “user friendly” de reasoning.

     Mucho conocimiento sin codificar en ontologías, o peor todavía, mal codificado:
            Contenido semántico “enterrado” en “anotaciones”.
            Larisa N Soldatova and Ross D King. Are the current ontologies in
            biology good ontologies?. Nature Biotechnology 23, 1095 - 1098 (2005)

     Más comunicación: diseñadores OWL – creadores de bio-ontologías.

     OBO format?
                                            
     “Killer app”.
El futuro de la Web Semántica en bioinformática


    Sistemas que representan el mismo dominio de conocimiento con diferentes
    formalismos integrados: BD, ontologías, simulaciones metabólicas, ...


    Publicar modelos (ontologías) en vez de/junto con artículos.


    Intervención humana:
        Validación experimental.
        La tecnología semántica no sustituye al investigador, simplemente le
            ahorra tiempo.




                                         
Agradecimientos, licencia, ¿Preguntas?



          EPSRC, University of Manchester


          UM, Jesualdo Tomás Fernández Breis


          Erick Antezana




          Mikel Egaña Aranguren
          Creative Commons Attribution License
          (http://creativecommons.org/licenses/by/2.0)




                                

Más contenido relacionado

Más de Mikel Egaña Aranguren, Ph.D.

Más de Mikel Egaña Aranguren, Ph.D. (8)

Populous swat4ls slides_slideshare
Populous swat4ls slides_slidesharePopulous swat4ls slides_slideshare
Populous swat4ls slides_slideshare
 
OPPL-Galaxy: Enhancing ontology exploitation in Galaxy with OPPL
OPPL-Galaxy: Enhancing ontology exploitation in Galaxy with OPPLOPPL-Galaxy: Enhancing ontology exploitation in Galaxy with OPPL
OPPL-Galaxy: Enhancing ontology exploitation in Galaxy with OPPL
 
Linked data functional genomics
Linked data functional genomicsLinked data functional genomics
Linked data functional genomics
 
Medioambiente Linked Data
Medioambiente Linked DataMedioambiente Linked Data
Medioambiente Linked Data
 
Applying sw mikel_egana
Applying sw mikel_eganaApplying sw mikel_egana
Applying sw mikel_egana
 
Mikel egana itbam_2010_ogo_system
Mikel egana itbam_2010_ogo_systemMikel egana itbam_2010_ogo_system
Mikel egana itbam_2010_ogo_system
 
Transforming the Axiomisation of Ontologies: The Ontology Pre-Processor Language
Transforming the Axiomisation of Ontologies: The Ontology Pre-Processor LanguageTransforming the Axiomisation of Ontologies: The Ontology Pre-Processor Language
Transforming the Axiomisation of Ontologies: The Ontology Pre-Processor Language
 
Ontology Design Patterns (ODPs) for bio-ontologies
Ontology Design Patterns (ODPs) for bio-ontologiesOntology Design Patterns (ODPs) for bio-ontologies
Ontology Design Patterns (ODPs) for bio-ontologies
 

Último

PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdfMiNeyi1
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptAlberto Rubio
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfNancyLoaa
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONALMiNeyi1
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 

Último (20)

PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Cuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdfCuaderno de trabajo Matemática 3 tercer grado.pdf
Cuaderno de trabajo Matemática 3 tercer grado.pdf
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 

Aplicación de la Web Semántica en Bioinformática

  • 1. Aplicación de la Web Semántica en Bioinformática http://mikeleganaaranguren.com/ Mikel Egaña Aranguren mikel.egana.aranguren@gmail.com School of Computer Science   University of Manchester  
  • 2. El problema ... ?    
  • 3. ... la solución ? ¡Web Semántica!    
  • 4. Bioinformática actual La Web Semántica Implantación de la Web Semántica en la bioinformática actual    
  • 5. Bioinformática actual: información vs conocimiento    
  • 6. De la biología molecular a la bioinformática Datos Secuencias, estructuras, microarrays ... Información Anotaciones: función, interacciones, localización celular, relaciones evolutivas, ... “Conocimiento” ¿Cuál es la función y la localización de los ortólogos provenientes de A. thaliana de mi proteina? Datos Información “Conocimiento”    
  • 7. Problemas de la bioinformática actual Miller CJ, Attwood TK. Bioinformatics goes back to the future. Nat Rev Mol Cell Biol. 2003 Feb;4(2):157-62. Exceso de información Preguntar vs navegar Ayuda para manejarla Q708Y0: ¿Localización celular?, ¿Función?, ¿Ortólogos?, ¿?, ... De recurso en recurso, no se puede “preguntar” No se pueden combinar diferentes “preguntas”    
  • 12. Web actual bla bla bla bla bla bla bla gato bla bla bla bla bla bla bla bla gato bla bla bla bla bla bla bla bla bla bla bla bla bla    
  • 13. Web actual Gato Persa    
  • 14. Web Semántica: metadatos y ontologías Ontología Ontología Maquinaria “buscador semántico”: taller gato (animal!) Animal es_un Metadato Felis silvestris catus bla bla bla bla bla bla Metadato bla bla bla bla gato bla Metadato bla bla bla bla bla bla bla gato bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla persa bla bla bla bla bla bla bla La Red semántica. Berners-Lee, Tim; Hendler, James y Lassila, Ora. Investigación y Ciencia: 298 - JULIO  2001  
  • 15. Web Semántica Web Semántica web de “conceptos” (vs docs) “preguntas” “Necesito buscar gatos negros que hayan residido sus dos primeros años en un centro de acogida dirigido por un equipo internacional, cerca de mi residencia” World Wide Web Consortium (W3C): http://www.w3.org/ W3C Semantic Web Activity: http://www.w3.org/2001/sw/ Resource Description Framework (RDF): Representar datos http://www.w3.org/RDF/ Web Ontology Language (OWL): Representar conocimiento sobre esos datos en ontologías http://www.w3.org/2004/OWL/    
  • 16. ¿Qué es una ontología? [filosofía] disciplina que describe lo existente. ONTOLOGIA [informática] conceptos + relaciones. CONTENIDO SEMANTICO procesable por un ordenador (indep. conceptos + relaciones estructura nombres relaciones + conceptos): Reasoning formalismo Organismo es_un Animal es_un es_un Felis silvestris Athene noctua catus    
  • 17. ¿Qué es una ontología? Animal es_un es_un Animal Animal diurno nocturno es_un Felis silvestris Caza catus Mus musculus es_un Caza Athene noctua    
  • 18. Funciones de una ontología Representación computacional de conceptos + relaciones Integración de recursos Vocabulario común Almacenar conocimiento (KB) Combinar/integrar conocimiento “Preguntas” sobre el conocimiento Reasoning Generación de hipótesis Consistencia Inferir conocimiento no evidente ...    
  • 19. ¿Qué es una ontología? Se crean usando un lenguaje de representación de conocimiento: OWL, ... Se “encarnan” en archivos.    
  • 20. ¿Qué es una ontología? Se manipulan con programas: Protégé, OBOEdit, ... “Reasoners”: Pellet, FaCT++, Racer, ...    
  • 21. Implantación de la Web Semántica en la bioinformática actual    
  • 22. Web Semántica en bioinformática Tecnología semántica Bioinformática: (OWL, RDF, ...) - Mucha información. - Muy compleja. - Muchos científicos creando metadatos. Matrimonio perfecto: - Bioinformáticos: explotar conocimiento. - Investigadores productores de tecnología semántica: casos de uso reales, requerimientos ...   Bio-ontologías  
  • 23. Web Semántica en bioinformática W3C Semantic Web Health Care and Life Sciences Interest Group: http://www.w3.org/2001/sw/hcls/ Good BM, Wilkinson MD.The Life Sciences Semantic Web is full of creeps! Brief Bioinform. 2006 Sep;7(3):275-86. Olivier Bodenreider, Robert Stevens.Bio-ontologies: current trends and future directions. Brief Bioinform, 7(3):256–274, 2006. Xiaoshu Wang, Robert Gorlitsky, Jonas S Almeida. From XML to RDF: how semantic web technologies will change the design of omic standards. Nat Biotechnol. 2005 Sep;23(9):1099-103.    
  • 24. Web Semántica en bioinformática OBO: Open Biomedical Ontologies (http://obofoundry.org/) Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration.Nat Biotechnol. 2007 Nov; 25(11):1251-5.    
  • 25. Web Semántica en bioinformática Gene Ontology (GO): http://www.geneontology.org/ The Gene Ontology Consortium. Gene Ontology: tool for the unification of biology. Nature Genet. (2000) 25: 25-29 Proceso biológico Vocabulario controlado Función molecular “Gen” (Gene Product) Localización celular Cierta structura: is_a, part_of, regulates.    
  • 26. Web Semántica en bioinformática Gene Ontology Explotar la estructura Integración de recursos Base de datos Q708YF Base de datos Q708YF Q8M34J Q708Y0 Base de datos CYC4;D Ontological analysis of gene expression data: current tools, limitations, and open problems.Bioinformatics. 2005 Sep 15;21(18):3587-95. Epub 2005 Jun 30.    
  • 27. Web Semántica en bioinformática EXITO DE GENE ONTOLOGY Michael Bada, Robert Stevens, Carole Goble, Yolanda Gil, Michael Ashburner, Judith A. Blake, J. Michael Cherry, Midori Harris, and Suzanna Lewis. A Short Study on the Success of the Gene Ontology . Web Semantics Science, Services and Agents on the World Wide Web, 1(2):235–240, 2004. PROBLEMAS DE GENE ONTOLOGY Solo is_a, part_of, regulates, no muy expresivo. OBO format (sin modelo semántico) vs RDF/OWL: Mikel Egaña Aranguren, Sean Bechhofer, Phillip Lord, Ulrike Sattler, Robert Stevens. Understanding and using the meaning of statements in a bio-ontology: recasting the Gene Ontology in OWL. BMC Bioinformatics 2007, 8:57. No usa reasoning: Mikel Egaña Aranguren, Chris Wroe, Carole Goble, Robert Stevens. In situ migration of handcrafted ontologies to Reason-able Forms. Data & Knowledge Engineering, in press.    
  • 28. Web Semántica en bioinformática EL DIVORCIO Test “Informáticos” OWL Biólogos Conocimiento biológico Test “Biólogos” OBO (?~OWL) Biólogos Conocimiento biológico Carole Goble and Chris Wroe. The Montagues and the Capulets. Comparative and Functional Genomics. Volume 5 (2004), Issue 8, Pages 623-632    
  • 29. Web Semántica en bioinformática Cell Cycle Ontology (CCO) http://www.cellcycleontology.org/    
  • 30. Web Semántica en bioinformática Cell Cycle Ontology (CCO)  Ontology Design Patterns for bio-ontologies: a case study on the Cell Cycle Ontology. Mikel Egaña Aranguren, Erick Antezana, Martin Kuiper, Robert Stevens. BMC bioinformatics 2008, 9(Suppl 5):S1. Transforming the Axiomisation of Ontologies: The Ontology Pre-Processor Language. M. Egaña; R. Stevens; E. Antezana. OWLED 2008, Fourth International Workshop - Washington, DC, USA. ONTO-PERL: An API supporting the development and analysis of bio- ontologies. E. Antezana; M. Egana; B. De Baets; M. Kuiper; V. Mironov. Bioinformatics 2008 24: 885-887; doi:10.1093/bioinformatics/btn042 A cell-cycle knowledge integration framework.E. Antezana; E. Tsiporkova; V. Mironov; and Kuiper, M.DILS 2006, LNBI 4075, pp. 19-34, 2006.    
  • 31. Web Semántica en bioinformática Cell Cycle Ontology (CCO) Enriquecimiento por integración Enriquecimiento axiomático OBO OWL OWL GO (Cell Cycle) CCO RDF XML GOA DOT GML XML (visANT) UniProt ODPs IntAct ... OBO: BioPortal, OLS, OBO-Edit OWL: Protégé, Ontology Server, reasoner OWL: Protégé, Ontology RDF: SPARQL (Virtuoso) Server, reasoner DOT: GraphViz GML: Cytoscape    
  • 32. Problemas de la Web Semántica en bioinformática FRUSTRACIÓN POR ... ... PERCEPCIÓN DEMASIADO POSITIVA DE LA TECNOLOGÍA Con meter todo en una ontología no es suficiente: hay que añadir axiomas, que es lo difícil. El reasoner no es el genio de la lámpara. Las ontologías no sirven para todo. “Semantics” buzz word. ... PERCEPCIÓN DEMASIADO NEGATIVA DE LA TECNOLOGÍA OWL es difícil de entender y no muy intuitivo (Unique Name Assumption, Open World Assumption). Es difícil crear una buena ontología: es difícil ver los beneficios a corto plazo. Tecnología todavía experimental:   los reasoners fallan en cosas incomprensibles.   trabajar con ontologías muy grandes es casi imposible.
  • 33. Problemas de la Web Semántica en bioinformática FALTA: Mano de obra: biólogos que conozcan el dominio (¡CCO!). Identificadores únicos para entidades: LSID: http://lsids.sourceforge.net/ URI: http://www.w3.org/2001/sw/hcls/notes/uris/ Herramientas más “user friendly” para crear ontologías o introducir contenido semántico en páginas web. Explicación “user friendly” de reasoning. Mucho conocimiento sin codificar en ontologías, o peor todavía, mal codificado: Contenido semántico “enterrado” en “anotaciones”. Larisa N Soldatova and Ross D King. Are the current ontologies in biology good ontologies?. Nature Biotechnology 23, 1095 - 1098 (2005) Más comunicación: diseñadores OWL – creadores de bio-ontologías. OBO format?     “Killer app”.
  • 34. El futuro de la Web Semántica en bioinformática Sistemas que representan el mismo dominio de conocimiento con diferentes formalismos integrados: BD, ontologías, simulaciones metabólicas, ... Publicar modelos (ontologías) en vez de/junto con artículos. Intervención humana: Validación experimental. La tecnología semántica no sustituye al investigador, simplemente le ahorra tiempo.    
  • 35. Agradecimientos, licencia, ¿Preguntas? EPSRC, University of Manchester UM, Jesualdo Tomás Fernández Breis Erick Antezana Mikel Egaña Aranguren Creative Commons Attribution License (http://creativecommons.org/licenses/by/2.0)