SlideShare una empresa de Scribd logo
1 de 27
Descargar para leer sin conexión
FastUMLS: Extracción de 
            conceptos en textos biomédicos

         Autor: José Luis Marina
         Director: Alberto Pascual

            Facultad de Informática
           Universidad Complutense
                   de Madrid




Máster en Investigación Informática UCM :: 2009   Dpto. Arquitectura de Computadores y Automática
Reinforcement Learning Bots
Motivación
Introducción::Índice


             Proporcionar un conjunto de conceptos 
         normalizados a partir de un conjunto de palabras

                                                        C1  Cancer [GO:00001]
                                                        C2 Apoptosis [MeSH:00]
 [wi, w2, …, wn]                           FastUMLS
                                                        …
                                                        Cm MRNA [UMLS:C000009]


                                             UMLS


  Dado un conjunto de conceptos identificar los que están más 
  relacionados con las palabras de entrada

 Máster en Investigación Informática UCM :: 2009      FastUMLS: José Luis Marina   2
Reinforcement Learning Bots
Motivación
Introducción::Índice


       SENT: Revisa textos relacionados con una lista de 
     GENES y los agrupa de acuerdo a una lista de palabras

                                                     Grupo1 
                                                      W= {membran, transport, signal,....} 
                                                      G= {Gen1 , Gen31 , Gen1 1 ,...}
                                                              0              0
 [Gen1, Gen2, …, Genn]               SENT            ...
                                                     Grupok 
                                                      W= {damag, replic, telomer,....} 
                                                      G= {Gen2, Gen21 , Gen221 ,Gen21 }
                                                                                    1

                                   PubMed



     ¿Podemos resumir esas palabras en uno o dos conceptos?

 Máster en Investigación Informática UCM :: 2009             FastUMLS: José Luis Marina       3
Reinforcement Learning Bots
Motivación
Introducción::Índice


            “Proporcionar un conjunto de conceptos 
        normalizados a partir de un conjunto de palabras”

 cancer, tumor, p53, factor, signal,                   (NCI) C39202: “Notch and Wnt Signaling Pathway“ 
 target, breast, pathwai, transcript 
 factor, growth, wnt, carcinoma,                       (NCI) C39270: “WNT Signaling Pathway”
 line, promot, notch                                   (GO) GO:0016055: “Wnt receptor signaling pathway” 


                    ++ De cualquier conjunto de palabras
      Activation­induced deaminase (AID) is required for class switch recombination 
      (CSR) and somatic hypermutation (SHM), which are responsible for secondary  ¿Podemos saber cuáles
      diversification of antibodies in germinal centers. AID initiates these processes by  son los principales
      deamination of cytosines on the immunoglobulin (Ig) locus, a potentially            conceptos/ideas sobre 
      mutagenic activity. AID expression is restricted to germinal­center B cells, but the 
      mechanisms that regulate its target specificity are not completely understood.              los que
      Here, we review the most recent findings on the regulation of AID targeting and       trata este artículo?
      discuss how AID activity on non­Ig genes is relevant to the generation of 
      chromosome translocations and to lymphomagenesis


 Máster en Investigación Informática UCM :: 2009                      FastUMLS: José Luis Marina                   4
Reinforcement Learning Bots
Conceptos: Bioinformática
Introducción::Índice




    La Bioinformática es el uso de técnicas matemáticas e 
    informáticas para almacenar, gestionar y analizar datos 
    biológicos  para  responder  a  problemas  de  la  biología 
    [Kaminski 2000].




Máster en Investigación Informática UCM :: 2009     FastUMLS: José Luis Marina   5
Reinforcement Learning Bots
Conceptos: Bioinformática
Introducción::Índice

    El  principal  problema  es  la  explosión  de  datos  en  el 
    campo de la biomedicina.
                               Información vs Conocimiento




Máster en Investigación Informática UCM :: 2009      FastUMLS: José Luis Marina   6
Reinforcement Learning Bots
Conceptos: Ontologías
Introducción::Índice

    Una  lista  que  contiene  los  términos  empleados  para  representar  los 
    conceptos, temas o contenidos de los documentos de un dominio, con 
    miras a efectuar una normalización terminológica que permita mejorar 
    el canal de acceso y comunicación entre los usuarios.


 Ontología = Conceptos + Relaciones → Representación Computacional

                                                  Integrar en un Vocabulario Común 
  Funciones
                                                  Almacenar Conocimiento

                                                  Permite Preguntar por Conocimiento




Máster en Investigación Informática UCM :: 2009              FastUMLS: José Luis Marina   7
Reinforcement Learning Bots
Conceptos: Ontologías
Introducción::Índice




Máster en Investigación Informática UCM :: 2009     FastUMLS: José Luis Marina   8
Reinforcement Learning Bots
Conceptos: Ontologías
Introducción::Índice

    ¿Cómo se crean y mantienen las Ontologías?

                          “Curators”: Expertos en el dominio del conocimiento


                              ●   Identifican los conceptos.
                              ●   Comprueban su corrección.
                              ●   Identifican las relaciones entre ellos.
                              ●   Detectan duplicados

                              ●   Revisión de artículos y literatura relacionada.
                              ●   Ayudados por herramientas automáticas.




Máster en Investigación Informática UCM :: 2009         FastUMLS: José Luis Marina   9
Reinforcement Learning Bots
UMLS
Introducción::Índice

 El  propósito  de  UMLS  ­  Unified  Medical  Language  System® 
 es  facilitar  el  desarrollo  de  sistemas  informáticos  que  se 
 comporten  como  si  entendieran  el  significado  del  lenguaje 
 utilizado en Biología y en Medicina.



                                            ●   Varios orígenes de datos “curados”.
                 UMLS                       ●   Conceptos, nombres, cadenas, orígenes.
                DataBase                    ●   Relaciones originales y nuevas.
                                            ●   Se puede cargar en un RDBMS como MySql.


                                            ●   Herramientas de PLN
               UMLS
               Tools
                                            ●   Java UMLS Database Navigators


 Máster en Investigación Informática UCM :: 2009             FastUMLS: José Luis Marina   10
Reinforcement Learning Bots
Conceptos de UMLS
Introducción::Índice
Conceptos y CUI

 Un concepto es un significado, que puede tener distintos nombres, pero no está 
 (no debe) estar repetido. “Dolor de Cabeza”, “Cefalea”

Términos e Identificadores Léxicos ­ LUI

 Agrupa un conjunto de variaciones léxicas de un mismo significado.
 “adenoidectomy”, “ADENOIDECTOMY” y “Adenoidectomies” → L0001425
Nombres de Conceptos y Cadenas ­ SUI

 Cada nombre de concepto o cadena en cada lenguaje en el Metathesaurus tiene
 un identificador único y permanente o SUI.
Átomos e Identificadores de Átomos ­ AUI

 Cada  vez  que  una  cadena  aparece  en  un  vocabulario  se  le  asigna  un 
 identificador único o AIU (“Atom Unique Identifier”). Si la misma cadena aparece 
 en  muchos  vocabularios  diferentes  se  le  asigna  a  cada  ocurrencia  un  AUI 
 distinto, y todos esos AUIs estarán relacionados con el mismo SUI.
Máster en Investigación Informática UCM :: 2009      FastUMLS: José Luis Marina        11
Reinforcement Learning Bots
Conceptos de UMLS
Introducción::Índice
Ejemplos
                                                            Concepto C0004057 →  “Aspirin”
                                                              Concepto C0004057 →  “Aspirin”
                                                            Aspirin 
                                                              Aspirin 
                                                            aspirin 
                                                              aspirin 
                                                            Acetylsalicylic Acid 
                                                              Acetylsalicylic Acid 
                                                            Acetylsalicylic acid 
                                                              Acetylsalicylic acid 
                                                            acetylsalicylic acid 
                                                              acetylsalicylic acid 
                                                            Acid, Acetylsalicylic 
                                                              Acid, Acetylsalicylic 
                                                            Acetysal 
                                                              Acetysal 
                                                            Acylpyrin 
                                                              Acylpyrin 
                                                            Colfarit 
                                                              Colfarit 
                                                            Easprin 
                                                              Easprin 
                                                            Ecotrin 
                                                              Ecotrin 
                                                            Endosprin 
                                                              Endosprin 
                                                            Magnecyl 
                                                              Magnecyl 
                                                            Micristin 
                                                              Micristin 
                                                            Polopiryna 
                                                              Polopiryna 
                                                            Zorprin 
                                                              Zorprin 
                                                            2­(Acetyloxy)benzoic Acid 
                                                              2­(Acetyloxy)benzoic Acid 
                                                            Benzoic acid, 2­(acetyloxy)­ 
                                                              Benzoic acid, 2­(acetyloxy)­ 
                                                            Aspergum 
                                                              Aspergum 
                                                            Empirin 
                                                              Empirin 
                                                            Entericin 
                                                              Entericin 
                                                            St. Joseph 
                                                              St. Joseph 
                                                            Measurin 
                                                              Measurin 
                                                            ACIDE ACETYLSALICYLIQUE 
                                                              ACIDE ACETYLSALICYLIQUE 
                                                            ACETYLSALICYLIQUE, ACIDE 
                                                              ACETYLSALICYLIQUE, ACIDE 
                                                            ASPIRINE 
                                                              ASPIRINE 
                                                            ASPIRIN 
                                                              ASPIRIN 
                                                            ASPIRINA 
                                                              ASPIRINA 
                                                            ACIDO ACETILSALICILICO
                                                              ACIDO ACETILSALICILICO




Máster en Investigación Informática UCM :: 2009     FastUMLS: José Luis Marina                 12
Reinforcement Learning Bots
Métodos
Introducción::Índice
Modelo de Procesos
                                                             C++
                                                             ACE
                                                             MySQL Client
                                                             Porter (Stemming)




                Ruby On Rails




                                                                         SQL




 Máster en Investigación Informática UCM :: 2009     FastUMLS: José Luis Marina   13
Reinforcement Learning Bots
Métodos
Introducción::Índice
Preprocesado: Modelo de Datos del que partimos

  MRCONSO
  +­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­­+­­­­­+ 
  | STR                           | LUI      | SUI      | AUI       | SAB | 
  +­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­­+­­­­­+ 
  | Primary Adrenal Insufficiency | L0494851  | S5907334 | A12807945 | NCI | 
  | Primary Adrenal Insufficiency | L0494851  | S5907334 | A6975965  | MSH | 
  +­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­­+­­­­­+ 

  MRXNS_ENG (Cadenas Normalizadas)
  +­­­­­+­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+ 
  | LAT | NSTR                          | CUI      | LUI      | SUI      | 
  +­­­­­+­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+ 
  | ENG | adrenal insufficiency primary | C0001403 | L0494851 | S5907334 | 
  +­­­­­+­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+ 


  MRXNW_ENG (Palabras Normalizadas)
  +­­­­­+­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+ 
  | LAT | NWD           | CUI      | LUI      | SUI      | 
  +­­­­­+­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+                “adrenal”
  | ENG | adrenal       | C0001403 | L0494851  | S5907334 | 
  | ENG | insufficiency | C0001403 | L0494851  | S5907334 | 
  | ENG | primary       | C0001403 | L0494851  | S5907334 |               LUIs o Términos
  +­­­­­+­­­­­­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+­­­­­­­­­­+ 


 Máster en Investigación Informática UCM :: 2009         FastUMLS: José Luis Marina         14
Reinforcement Learning Bots
Métodos
Introducción::Índice
Preprocesado: Modelo de Datos que queremos
FU_MRXSNWCONSO_ENG
+-------------+--------------+------+-----+---------+-------+
| Field       | Type         | Null | Key | Default | Extra |
                                                                                        “adrenal”
+-------------+--------------+------+-----+---------+-------+
| CUI         | varchar(8)   | NO   |     | NULL    |       |
| LUI         | varchar(8)   | NO   | MUL | NULL    |       |
| SNWD        | varchar(100) | NO   | MUL | NULL    |       |                           “adren”
| SNWD_CARD   | int(11)      | NO   |     | NULL    |       |
| LUI_CARD    | int(11)      | NO   |     | NULL    |       |
| LUI_WEIGHT | double        | NO   |     | NULL    |       |
| SNWD_WEIGHT | double       | NO   |     | NULL    |       |
+-------------+--------------+------+-----+---------+-------+




+----------+----------+-------+-----------+----------+------------------+------------------+
| CUI      | LUI      | SNWD | SNWD_CARD | LUI_CARD | LUI_WEIGHT        | SNWD_WEIGHT      |
+----------+----------+-------+-----------+----------+------------------+------------------+
| C1403891 | L0368421 | adren |      1770 |        3 | 7.79257425770879 | 3.90412658114857 |
| C0001403 | L0278071 | adren |      1770 |        4 | 9.15101108465032 | 3.90412658114857 |
| C0001403 | L0278357 | adren |      1770 |        3 | 7.35481996167742 | 3.90412658114857 |
| C0300942 | L0278357 | adren |      1770 |        3 | 7.35481996167742 | 3.90412658114857 |
| C0001403 | L0494851 | adren |      1770 |        3 | 7.28466969560075 | 3.90412658114857 |
| C0001613 | L0001613 | adren |      1770 |        2 | 5.76357355441712 | 3.90412658114857 |
| C0001613 | L0683397 | adren |      1770 |        3 | 6.60864930712491 | 3.90412658114857 |
| C0001614 | L0001614 | adren |      1770 |        3 | 6.64237861631983 | 3.90412658114857 |
| C0001614 | L1191251 | adren |      1770 |        3 | 7.03641625689895 | 3.90412658114857 |
| C0001614 | L6329909 | adren |      1770 |        3 | 6.70017421906099 | 3.90412658114857 |
+----------+----------+-------+-----------+----------+------------------+------------------+


 Máster en Investigación Informática UCM :: 2009                 FastUMLS: José Luis Marina         15
Reinforcement Learning Bots
Métodos
Introducción::Índice
Proceso FastUMLS


[ei, e2, …, en]                    FastUMLS                                        BD




                                                    Términos Ordenados por Peso:
          e1   e2   ...   ei        en                  ●   Promiscuidad de las palabras
    L1    1    0          0         0                   ●   Palabras de la entrada en el Término
    L2    1    1          0         0
                                                        ●   Palabras totales del Término

    ...        0          1         0               Un Término que tiene asociadas palabras muy 
    Li    1    1          0         0               genéricas  –  palabras  que  están  presentes  en 
    ...   0    0          0         1               muchos  otros  conceptos  –  tiene  mayor 
                                                    probabilidad  de  salir  que  otro  relacionado con 
    Lm    0    1          0         1               palabras menos generales. 



 Máster en Investigación Informática UCM :: 2009                       FastUMLS: José Luis Marina          16
Reinforcement Learning Bots
Métodos
Introducción::Índice
Proceso FastUMLS
 E={e1, e2,... , e m }                                                        card  p 
                                                   w p=∣log  P  p∣=∣log             ∣
 U ={ p1 , p 2 , ... , p u }                                                     T
 T ={l 1 ,l 2 ,... , l T }                         w li = w pi1 ²w pi2 ²...w pix ²
 l j ={ p j1 , p j2 , ... , p jx }
  M , mij ∈[0,1]                                                        m j1 · w e1 ²m j2 · w e2 ²...m jm · wem ²
                                                  W lj  E=
                                                                w pj1 ²w pj2 ²...w pjx ² ·  w e1 ²w e2 ²...w em ²
         e1    e2    ...   ei          en                         m j1 · w e1 ²m j2 · we2 ²...m jm · w em ²
                                                       W lj  E=
  L1     0     1           0           1                                             wlj · w E
  L2     1     1           0           1
                                                Ponderar  la  probabilidad  de  que  hubieran  salido 
  ...          0           0           1        seleccionados  si  el  conjunto  de  entrada  se  hubiera 
  Li     0     1           0           0        escogido al azar.
  ...    0     0           0           0
                                                Penalización de términos con alta probabilidad ­  debido a 
  Lm     0     1           0           0        lo genérico de sus palabras.

 Máster en Investigación Informática UCM :: 2009                               FastUMLS: José Luis Marina                   17
Reinforcement Learning Bots
Métodos
Introducción::Índice
Estado del Arte: ¿Hay Procesos Similares?

Técnicas de Procesamiento del Lenguaje Natural PLN:
  Procesan textos completos buscando párrafos, sentencias y proposiciones.
  Tratan una a una las proposiciones y muestran los conceptos relacionados.

  + Identifican significados, por ejemplo las negaciones. (“No agresivo”)
  ­ No relacionan palabras en párrafos o frases diferentes.
  ­ Suelen ser lentos porque demandan mucha capacidad de proceso.

 Técnicas de Permutación de Palabras (Como FastUMLS)
 IndexFinder: Procesa todas las palabras de un texto buscando para cada palabra los 
 conceptos relacionados, y muestra conceptos con todas las palabras.

  + Utiliza palabras en párrafos o frases diferentes
  + Rápido
  ­ No Identifica significados. (“No agresivo”)
  ­ No muestra conceptos sin acierto en Todas las palabras

 Máster en Investigación Informática UCM :: 2009          FastUMLS: José Luis Marina   18
Reinforcement Learning Bots
Resultados
Introducción::Índice
Rendimiento


                                              Palabras en el   Elementos         Segundos
  14 millones de registros                    Texto            Matriz
  3 millones de conceptos
                                                        200            50.000                < 20
                                                         12             5.000                 <2



                                                                       e1   e2   ...   ei      en
       BD                               FastUMLS                 L1    0    1          0       1
                                                                 L2    1    1          0       1
                                                                 ...        0          0       1
                                                                 Li    0    1          0       0
                                                                 ...   0    0          0       0
                                                                 Lm    0    1          0       0


 Máster en Investigación Informática UCM :: 2009                FastUMLS: José Luis Marina          19
Reinforcement Learning Bots
Resultados
Introducción::Índice
Pruebas Comparativas (PLN ­  Interactive  MetaMap IM)

Identificación de Conceptos en Genes Anotados por Expertos
  Objetivo: Comparar FU contra una herramienta y resultados anotados por expertos. 
  Expertos han anotado Genes con conceptos de Gene Ontology (GO)
  Se han procesado los textos de descripción de varios genes buscando esos conceptos.


    IM:  
      No ha encontrado en ningún caso ninguno de los conceptos.
      No utiliza palabras muy alejadas en el texto.
      Conceptos muy genéricos y por frase.

    FastUMLS: 
      30 a 40% de los conceptos (Posición 200 del array) 
      Muestra conceptos de más vocabularios (no sólo GO)
      Parece coherente revisar los resultados con expertos (*)


 Máster en Investigación Informática UCM :: 2009       FastUMLS: José Luis Marina       20
Reinforcement Learning Bots
Resultados
Introducción::Índice
Pruebas Comparativas (PLN ­  Interactive  MetaMap IM)

Comparación de Resultados Directa. 
  Objetivo: Comparar resultados con una herramienta utilizada y referenciada. 
  Se procesan  la misma frases (200) según las identifica IM dentro de un texto científico.
  Comparamos si los conceptos son los mismos y si están en las 20 posiciones iniciales.



FastUMLS: 
  En el 62% de los casos se recuperan los mismos conceptos.
  En el 81% de los casos se recuperan más de la mitad de los conceptos.
  Tiende a penalizar conceptos genéricos (“enfermedad” frente “fiebre”)

IM:
  Identifica negaciones y evita algunos resultados (“not cancerigenous gen”)
  




 Máster en Investigación Informática UCM :: 2009            FastUMLS: José Luis Marina        21
Reinforcement Learning Bots
Resultados
Introducción::Índice
Pruebas Supervisadas – Investigadores en Biomedicina

Revisión de los resultados por Expertos – Test (5 investigadores, 23 artículos)
  Objetivo: Comprobar la idoneidad o no de los conceptos ofrecidos. 
  Varios investigadores procesan el resumen de artículos escritos por ellos mismos.
  De acuerdo a los conceptos ofrecidos resultados contestan a un test por cada artículo.

    Para cada uno de los artículos y atendiendo sólo a los 20 primeros conceptos valore cada una
    de las siguientes preguntas:
1.- Los conceptos ofrecidos son correctos...             2.- Respecto a los conceptos ofrecidos, ¿se echa de
 a) En un 100%.                                          menos algún concepto relacionado con el artículo?
 b) Entre 80% y 100%                                      a) No, ninguno.
 c) Entre 50% y 80%                                       b) Sí, uno
 d) En menos de un 50%                                    c) Sí, dos.
                                                          d) Sí, más de dos.

3.- Respecto a la especificidad de los conceptos         4.- La valoración general de los resultados es:
ofrecidos... (un concepto demasiado general sería         a) Muy buena.
"enfermedad" en un artículo sobre "la enfermedad          b) Buena, pero necesita mejorar.
Alzheimer")                                               c) Media, necesita mejorar bastante.
 a) Son bastante específicos en su mayoría.               d) Mala.
 b) En general hay conceptos específicos y genéricos a
partes iguales.
 c) En general son demasiado genéricos.


 Máster en Investigación Informática UCM :: 2009                    FastUMLS: José Luis Marina                 22
Reinforcement Learning Bots
Resultados
Introducción::Índice
Pruebas Supervisadas – Investigadores en Biomedicina
         Correción conceptos                ¿Faltan Conceptos?


                               100%                              No
                               >80%                              1
                               >50%                              2
                               <50%                              >2




 ●   60% ­ Más de un  80% de los conceptos son adecuados.
 ●   85% ­ Más de la mitad de los conceptos ofrecidos son correctos.

 ●   35% ­ No se ha echado en falta ningún concepto.
 ●   95% ­ El número de conceptos a incorporar no es mayor que dos.




 Máster en Investigación Informática UCM :: 2009                      FastUMLS: José Luis Marina   23
Reinforcement Learning Bots
Resultados
Introducción::Índice
Pruebas Supervisadas – Investigadores en Biomedicina
        ¿Son Específicos?                    Valoración General


                                                                  Buena+
                            > 90%                                 -Buena
                            >50%
                                                                  Media
                            <50%
                                                                  Mala




 ●   48% ­ Los conceptos son específicos en un 90%
 ●   100% ­ La mitad de los conceptos o más son específicos.

 ●   60% ­ la herramienta ofrece resultados buenos o más que buenos.
 ●   75% ­ los resultados son buenos pero necesitan mejorar.




 Máster en Investigación Informática UCM :: 2009                           FastUMLS: José Luis Marina   24
Reinforcement Learning Bots
Resultados
Introducción::Índice
Conclusiones

    FastUMLS es eficaz y preciso a la hora de ofrecer conceptos de UMLS relacionados 
    con un texto corto o una lista de palabras, permutando las mismas y asignado pesos.


    FastUMLS es eficaz y útil para la anotación automática de textos largos que traten 
    sobre un mismo tema.


    Asignar pesos a los términos en base a la probabilidades se muestra como mejor 
    estrategia que mostrar sólo los términos con aciertos totales. 


    Preprocesar los datos y los cálculos de pesos incrementa notablemente el rendimiento. 



    FastUMLS debe mejorar en aspectos como: La redundancia de conceptos, en el 
    preprocesado de cadenas cortas (“10”) y en la identificación de negaciones, 



 Máster en Investigación Informática UCM :: 2009           FastUMLS: José Luis Marina        25
Reinforcement Learning Bots
Líneas Futuras
Introducción::Índice
Enriquecer las búsquedas

    Incorporar al flujo de proceso las relaciones entre conceptos y los grupos semánticos 
    que ofrece UMLS, y así incrementar el número de conceptos a tratar y a ponderar


Creación de Bases de Datos de Textos anotados

    Procesar los numerosos artículos científicos de PubMed para asociar conceptos a cada 
    uno. Utilizar esta bases de datos para mejorar las búsquedas de documentos 
    relacionados con uno dado a través de sus conceptos.


Identificación de Grupos de Conceptos y Palabras o Textos

    Utilizar técnicas de bi­clustering para identificación de grupos en la matriz de palabras 
    por conceptos que ofrece FastUMLS, y poder inferir relaciones entre los conceptos de 
    cada grupo.




 Máster en Investigación Informática UCM :: 2009             FastUMLS: José Luis Marina          26
¿Preguntas?


Extracción de Conceptos en Textos Biomédicos

                 Facultad de Informática
                Universidad Complutense
                        de Madrid                     27




             José Luis Marina :: Máster UCM :: 2009

Más contenido relacionado

Destacado

Apatie sau pasiune
Apatie sau pasiuneApatie sau pasiune
Apatie sau pasiuneCosmin Bilan
 
Tajna zaleđenih mamuta
Tajna zaleđenih mamutaTajna zaleđenih mamuta
Tajna zaleđenih mamutaStanka Popov
 
Zázvorový čaj tianDe
Zázvorový čaj tianDeZázvorový čaj tianDe
Zázvorový čaj tianDeLa Lavande
 
C ciz seminar cktzj 2010 priloha
C ciz seminar cktzj 2010 prilohaC ciz seminar cktzj 2010 priloha
C ciz seminar cktzj 2010 prilohaJosef Zemek
 
O pismu a jeho prezentaci
O pismu a jeho prezentaciO pismu a jeho prezentaci
O pismu a jeho prezentaciMatěj Málek
 
Automatización de un arrancador λ – ∆
Automatización de un arrancador  λ – ∆Automatización de un arrancador  λ – ∆
Automatización de un arrancador λ – ∆Christian Rhomo Rhomo
 
COFI - Koncept nového interiéru ÚMK
COFI - Koncept nového interiéru ÚMKCOFI - Koncept nového interiéru ÚMK
COFI - Koncept nového interiéru ÚMKCup Of Inspiration
 
Krizemk razem po cr tereza
Krizemk razem po cr   terezaKrizemk razem po cr   tereza
Krizemk razem po cr terezaTereza951
 
Você é aquilo que entrega
Você é aquilo que entregaVocê é aquilo que entrega
Você é aquilo que entregaDanilo Simões
 
Edward Bulwer Lytton - Strasidelny Dum
Edward Bulwer Lytton - Strasidelny DumEdward Bulwer Lytton - Strasidelny Dum
Edward Bulwer Lytton - Strasidelny DumAlA 777
 
[Hungarian] HTML Course - Sapientia University
[Hungarian] HTML Course - Sapientia University[Hungarian] HTML Course - Sapientia University
[Hungarian] HTML Course - Sapientia UniversityZoltan Iszlai
 
Bahan ajar tik
Bahan ajar tikBahan ajar tik
Bahan ajar tikzaviro
 
Av technika 2
Av technika 2Av technika 2
Av technika 2olc_user
 
Aspectio - Company Presentation (Czech)
Aspectio - Company Presentation (Czech)Aspectio - Company Presentation (Czech)
Aspectio - Company Presentation (Czech)Vrozina
 
Co je agilní implementace HR systému?
Co je agilní implementace HR systému?Co je agilní implementace HR systému?
Co je agilní implementace HR systému?MMI, s.r.o.
 

Destacado (20)

Apatie sau pasiune
Apatie sau pasiuneApatie sau pasiune
Apatie sau pasiune
 
Tajna zaleđenih mamuta
Tajna zaleđenih mamutaTajna zaleđenih mamuta
Tajna zaleđenih mamuta
 
Zázvorový čaj tianDe
Zázvorový čaj tianDeZázvorový čaj tianDe
Zázvorový čaj tianDe
 
C ciz seminar cktzj 2010 priloha
C ciz seminar cktzj 2010 prilohaC ciz seminar cktzj 2010 priloha
C ciz seminar cktzj 2010 priloha
 
ISSS 2011: Přínosy standardizace správy dokumentů dle ISO 15489
ISSS 2011: Přínosy standardizace správy dokumentů dle ISO 15489ISSS 2011: Přínosy standardizace správy dokumentů dle ISO 15489
ISSS 2011: Přínosy standardizace správy dokumentů dle ISO 15489
 
Gotická klenba
Gotická klenbaGotická klenba
Gotická klenba
 
Tash 2
Tash 2Tash 2
Tash 2
 
O pismu a jeho prezentaci
O pismu a jeho prezentaciO pismu a jeho prezentaci
O pismu a jeho prezentaci
 
Automatización de un arrancador λ – ∆
Automatización de un arrancador  λ – ∆Automatización de un arrancador  λ – ∆
Automatización de un arrancador λ – ∆
 
COFI - Koncept nového interiéru ÚMK
COFI - Koncept nového interiéru ÚMKCOFI - Koncept nového interiéru ÚMK
COFI - Koncept nového interiéru ÚMK
 
Krizemk razem po cr tereza
Krizemk razem po cr   terezaKrizemk razem po cr   tereza
Krizemk razem po cr tereza
 
Você é aquilo que entrega
Você é aquilo que entregaVocê é aquilo que entrega
Você é aquilo que entrega
 
Edward Bulwer Lytton - Strasidelny Dum
Edward Bulwer Lytton - Strasidelny DumEdward Bulwer Lytton - Strasidelny Dum
Edward Bulwer Lytton - Strasidelny Dum
 
[Hungarian] HTML Course - Sapientia University
[Hungarian] HTML Course - Sapientia University[Hungarian] HTML Course - Sapientia University
[Hungarian] HTML Course - Sapientia University
 
Bahan ajar tik
Bahan ajar tikBahan ajar tik
Bahan ajar tik
 
Mpi ds p_01 (1)
Mpi ds p_01 (1)Mpi ds p_01 (1)
Mpi ds p_01 (1)
 
Av technika 2
Av technika 2Av technika 2
Av technika 2
 
483 2001 zz_v20160101
483 2001 zz_v20160101483 2001 zz_v20160101
483 2001 zz_v20160101
 
Aspectio - Company Presentation (Czech)
Aspectio - Company Presentation (Czech)Aspectio - Company Presentation (Czech)
Aspectio - Company Presentation (Czech)
 
Co je agilní implementace HR systému?
Co je agilní implementace HR systému?Co je agilní implementace HR systému?
Co je agilní implementace HR systému?
 

Más de Joselu Marina

La vida real: Presentando un proyecto innovador a H2020
La vida real: Presentando un proyecto innovador a H2020La vida real: Presentando un proyecto innovador a H2020
La vida real: Presentando un proyecto innovador a H2020Joselu Marina
 
Kubernetes: Caso de uso real con mememtum y Taniwa
Kubernetes: Caso de uso real con mememtum y TaniwaKubernetes: Caso de uso real con mememtum y Taniwa
Kubernetes: Caso de uso real con mememtum y TaniwaJoselu Marina
 
Visión sobre tecnología y medicina
Visión sobre tecnología y medicinaVisión sobre tecnología y medicina
Visión sobre tecnología y medicinaJoselu Marina
 
mememtum: presentación para inversores - IESE Jul 2013
mememtum: presentación para inversores - IESE Jul 2013mememtum: presentación para inversores - IESE Jul 2013
mememtum: presentación para inversores - IESE Jul 2013Joselu Marina
 
mememtum: Móviles para la salud
mememtum: Móviles para la saludmememtum: Móviles para la salud
mememtum: Móviles para la saludJoselu Marina
 
Taniwa: Servicios y productos
Taniwa: Servicios y productosTaniwa: Servicios y productos
Taniwa: Servicios y productosJoselu Marina
 
Sharing Osmius experiences in Startup Boot Camp Ma
Sharing Osmius experiences in Startup Boot Camp MaSharing Osmius experiences in Startup Boot Camp Ma
Sharing Osmius experiences in Startup Boot Camp MaJoselu Marina
 
Osmius: RoadMap (MadridOnRails)
Osmius: RoadMap (MadridOnRails)Osmius: RoadMap (MadridOnRails)
Osmius: RoadMap (MadridOnRails)Joselu Marina
 
Osmius: Monitoriza tu negocio
Osmius: Monitoriza tu negocioOsmius: Monitoriza tu negocio
Osmius: Monitoriza tu negocioJoselu Marina
 
bioLabeler para primerViernes
bioLabeler para primerViernesbioLabeler para primerViernes
bioLabeler para primerViernesJoselu Marina
 
Uso GPUs para alineación de secuencias de Genes
Uso GPUs para alineación de secuencias de GenesUso GPUs para alineación de secuencias de Genes
Uso GPUs para alineación de secuencias de GenesJoselu Marina
 
Priorización de Requisitos
Priorización de RequisitosPriorización de Requisitos
Priorización de RequisitosJoselu Marina
 
Aprendizaje por Refuerzo: Luchas de Robots
Aprendizaje por Refuerzo: Luchas de RobotsAprendizaje por Refuerzo: Luchas de Robots
Aprendizaje por Refuerzo: Luchas de RobotsJoselu Marina
 

Más de Joselu Marina (15)

La vida real: Presentando un proyecto innovador a H2020
La vida real: Presentando un proyecto innovador a H2020La vida real: Presentando un proyecto innovador a H2020
La vida real: Presentando un proyecto innovador a H2020
 
Kubernetes: Caso de uso real con mememtum y Taniwa
Kubernetes: Caso de uso real con mememtum y TaniwaKubernetes: Caso de uso real con mememtum y Taniwa
Kubernetes: Caso de uso real con mememtum y Taniwa
 
Visión sobre tecnología y medicina
Visión sobre tecnología y medicinaVisión sobre tecnología y medicina
Visión sobre tecnología y medicina
 
mememtum: presentación para inversores - IESE Jul 2013
mememtum: presentación para inversores - IESE Jul 2013mememtum: presentación para inversores - IESE Jul 2013
mememtum: presentación para inversores - IESE Jul 2013
 
mememtum: Móviles para la salud
mememtum: Móviles para la saludmememtum: Móviles para la salud
mememtum: Móviles para la salud
 
Taniwa: Servicios y productos
Taniwa: Servicios y productosTaniwa: Servicios y productos
Taniwa: Servicios y productos
 
Sharing Osmius experiences in Startup Boot Camp Ma
Sharing Osmius experiences in Startup Boot Camp MaSharing Osmius experiences in Startup Boot Camp Ma
Sharing Osmius experiences in Startup Boot Camp Ma
 
Abredatos2011
Abredatos2011Abredatos2011
Abredatos2011
 
Osmius: RoadMap (MadridOnRails)
Osmius: RoadMap (MadridOnRails)Osmius: RoadMap (MadridOnRails)
Osmius: RoadMap (MadridOnRails)
 
Osmius: Monitoriza tu negocio
Osmius: Monitoriza tu negocioOsmius: Monitoriza tu negocio
Osmius: Monitoriza tu negocio
 
bioLabeler para primerViernes
bioLabeler para primerViernesbioLabeler para primerViernes
bioLabeler para primerViernes
 
Uso GPUs para alineación de secuencias de Genes
Uso GPUs para alineación de secuencias de GenesUso GPUs para alineación de secuencias de Genes
Uso GPUs para alineación de secuencias de Genes
 
Priorización de Requisitos
Priorización de RequisitosPriorización de Requisitos
Priorización de Requisitos
 
Osmius morfeo2010
Osmius morfeo2010Osmius morfeo2010
Osmius morfeo2010
 
Aprendizaje por Refuerzo: Luchas de Robots
Aprendizaje por Refuerzo: Luchas de RobotsAprendizaje por Refuerzo: Luchas de Robots
Aprendizaje por Refuerzo: Luchas de Robots
 

Extracción automática de conceptos de Textos Biomédicos