SlideShare una empresa de Scribd logo
Minería de Procesos
Descubriendo nuevas líneas de investigación
para Profesionales de las TIC de Antonio Valle Salas
4 novembre de 2016
The Critical Need of Value
MINERÍA DE PROCESOS
Descubriendo nuevas líneas de investigación de las neoplasias
mediante minería de procesos
RESUMEN
En este proyecto G2, junto con un equipo de investigación del Institut Català d’Oncologia,
analizó mediante técnicas de Minería de Procesos la evolución de los pacientes que han
sufrido múltiples episodios de cáncer.
Los resultados fueron sorprendentes: utilizar estas técnicas permitió a los investigadores
tener una visión temporal de las neoplasias, visualizar claramente los patrones de aparición
de segundos y sucesivos tumores y descubrir relaciones y comportamientos de las
neoplasias que hasta el momento del estudio no estaban claros.
PROYECTO
La Minería de Procesos se puede utilizar para el análisis de cualquier tipo de información en
la que se produzca un cambio en el tiempo.
El ICO lleva desde el año 2005 realizando una investigación detallada sobre la aparición y
evolución de siete tipos distintos de tumores cancerígenos: Colo-Rectal, Pulmón, Mama,
Leucemia, Linfoma, Mieloma y Sistema Nervioso Central. Durante este periodo se ha
recopilado información detallada sobre la aparición de cada una de las neoplasias.
Los equipos de investigación buscan patrones y relaciones entre la aparición del primer, el
segundo y los sucesivos tumores en un paciente que les permitan establecer nuevos
protocolos de monitorización de los pacientes: una detección temprana aumenta en gran
medida las posibilidades de su supervivencia y su calidad de vida.
Así, se plantearon al equipo de proyecto tres retos:
a)	 ¿Cuáles son los patrones fundamentales que sigue la aparición de neoplasias
sucesivas? ¿Existen relaciones que no estén descritas y que puedan servir como
punto de partida de nuevas líneas de investigación?
b)	 ¿Podemos representar un mapa que sirva de guía y de herramienta de comunicación
para que los médicos de atención primaria estén alerta ante los síntomas o señales
que se muestran en la aparición de cáncer sucesivo?
c)	 Paralelamente y de forma adicional, ¿podríamos generar algún material de
comunicación que nos permita tener una visión temporal de la evolución de los
pacientes?
G2, Gobierno y Gestión de TI 1
Descubriendo nuevas líneas de investigación
G2 propuso utilizar la solución Disco, del fabricante holandés Fluxicon, para llevar a cabo los
análisis de los datos mediante técnicas de minería de procesos, por la gran agilidad y
usabilidad en los análisis que proporciona Disco.
DATOS
Para realizar este análisis se extrajeron de los sistemas de información del ICO los datos
sobre la aparición de tumores en forma de event log, en el que cada evento representa un
tumor y cada caso un paciente; la información sobre tumores venía enriquecida con
aspectos clínicos y demográficos tanto del paciente (sexo, edad, etc.) como del tumor
(clasificación, aspectos clínicos, etc.)
La extracción de los datos se realizó utilizando las herramientas y el datawarehouse que ya
existían en la organización: un sistema de almacenamiento y ETL basado en Kettle ya
integrado con la información de los sistemas operacionales y que es utilizado en las tareas
de investigación y reporting. La existencia previa de esta información y de este sistema ETL
facilitó enormemente la tarea, ya que no hubo que realizar esfuerzos especialmente
importantes en la extracción de datos.
El event log a analizar se componía de 3800
casos y 4782 eventos y unas primeras
comprobaciones permitieron descubrir que
el grado de calidad de los datos era
excelente: apenas un 0,21% de los casos
contenían errores, los cuales fueron
detectados rápidamente con Disco.
Después de verificar la información en los
sistemas operacionales, el equipo encontró
que los errores se correspondían a casos
duplicados en los sistemas de origen y a
errores de apreciación en la historia clínica,
errores que fueron corregidos en el origen
antes de repetir la exportación de datos a
Disco.
El siguiente reto con el que nos encontramos fue con la necesidad de agrupar los tumores
por categorías: la primera extracción de datos contenía gran cantidad de actividades (462)
debido al nivel de detalle con el que se clasifican los tumores en la historia clínica. Con ayuda
de la oncóloga del equipo se asignó a cada una de estas actividades una categoría que nos
permitía agrupar los tumores objeto del estudio en los 7 grandes grupos mencionados en la
introducción, reduciendo el número de actividades a 19.
G2, Gobierno y Gestión de TI2
Fig. 1 Secuencia de neoplasis que muestra problemas de
calidad de los datos: ¿5 pacientes empiezan con el
“segundo” tumor?
MINERÍA DE PROCESOS
Así, por ejemplo, se asignó la categoría “Mama” a los tumores clasificados como “Cuadrante
inferior interno de la mama” o “Cuadrante superior interno de la mama” o “Prolongación
Axilar de la mama”.
Una vez que ya disponíamos del dataset correcto se aplicó un filtro para descartar todos
aquellos casos que habían padecido un único tumor, ya que el estudio se debía centrar en
los casos múltiples dejando la muestra reducida a 792 casos (pacientes), 1776 eventos
(tumores) y 19 actividades (tipologías de tumor).
RESULTADOS
El proceso de análisis fue muy intenso, con todo el equipo presente durante los dos días que
dedicamos a explorar la información proporcionada. Rápidamente las técnicas de Minería de
Procesos se ganaron la confianza y el respeto de los miembros del ICO. La primera
representación fue, como cabía esperar, un diagrama de espaguetis por lo que, liderados por
la oncóloga del equipo, pasamos a realizar varias representaciones de las diferentes
casuísticas según nos lo iba pidiendo.
La primera comprobación fue un
diagrama de supervivencia (figura
2). En él se puede observar
claramente cómo el 69,45% de
los pacientes analiza do s
sobrevive al primer tumor; un
60,6% sobrevive al segundo y un
63,4% lo hace al tercero: una
información que el equipo de
investigación ya conocía, pero
q u e a l s e r re p re s e n t a d a
gráficamente ganaba un gran
peso como herramienta de
comunicación médica.
Por otra parte, explorar un terreno conocido sirvió para afianzar la confianza en las nuevas
técnicas empleadas.
Para explorar diferentes maneras de representar los patrones que presentan los datos
utilizamos una representación de mapa filtrado (mostrando los casos que se iniciaban con
cualquiera de los 7 tipos de neoplasia objeto de la investigación), la representación de las
variantes que proporciona Disco y el visualizador “Explore Event Log (trace variants)”.
G2, Gobierno y Gestión de TI 3
Fig. 2 Diagrama de secuencia y supervivencia
Descubriendo nuevas líneas de investigación
De esta manera, la representación de mapa de Disco cubría todos los objetivos del estudio.
Por ejemplo, la figura. 3 muestra cómo los pacientes que han sufrido un primer episodio de
cáncer de mama y que posteriormente presentan un segundo tumor o sucesivo presentan
mayor probabilidad de desarrollar un segundo tumor de mama que otros tipos de tumores.
Por otra parte, al analizar las variantes mediante el
visualizador de ProM (figura 4), se descubrió la fuerte
relación que había entre las tipologías Pulmón y CCR
(Colo-Rectal), haciendo aflorar un patrón que hasta el
momento había permanecido oculto y que servirá para
abrir líneas de investigación en el futuro.
G2, Gobierno y Gestión de TI4
Fig. 3 Patrones en el cáncer de mama
Fig. 4 Patrones / Variantes en ProM
MINERÍA DE PROCESOS
Una vez detectada esta relación, se filtraron los casos en Disco para obtener una visión más
ajustada y se pudo observar que aproximadamente un 9% de los casos presentan ambos
tipos de neoplasia, tal y como podemos ver en la figura 5.
BENEFICIOS
Este proyecto ha generado beneficios importantes en diferentes perspectivas:
En el equipo de investigación del ICO: El equipo de investigación del ICO ha podido
comprobar en primera instancia las ventajas que proporciona la minería de procesos para
aportar nuevas perspectivas del estudio de la información. Los nuevos métodos de estudio y
representación de la información abren puertas a nuevas ideas y avances en la investigación.
En la manera de presentar la información: En general los estudios que se han venido
realizando en el ámbito de la Oncología en Catalunya están fuertemente ligados a métodos
estadísticos o de diagnóstico por la imagen. La nueva forma de visualizar el flujo de los
tumores ha sido relevante, y usar gráficas de variantes en ProM o animaciones de Disco ha
sido determinante para ganar la atención del resto de equipos de investigación.
En la práctica de minería de procesos: Este ha sido el primer caso de aplicación de la
minería de procesos a la investigación de la evolución de tumores. Había bastantes
referencias del uso de la minería de procesos en el sector salud, pero siempre orientado al
flujo o a la gestión hospitalaria y no a la investigación de enfermedades.
En la presentación de resultados a la sociedad: Durante los días 21 y 22 de Abril de
2016 se llevó a cabo el simposio ICO 10mes10 en el que el ICO presentaba los resultados
de sus 20 años de actividad a la sociedad.
G2, Gobierno y Gestión de TI 5
Fig. 5 Relación entre Pulmón y CCP.
Descubriendo nuevas líneas de investigación
Entre los más de 500 asistentes al simposio se encontraban los médicos e investigadores
más relevantes de Catalunya. La única conferencia que se repitió los dos días del congreso
fue la dictada por el Dr. José Ramón Germà presentando los resultados de los análisis de
supervivencia en los siete tumores analizados (demostrando que la supervivencia en
Catalunya es la más alta del mundo); durante esa conferencia, el Dr. Germà proyectó un
video mostrando las animaciones realizadas con Disco y mencionando específicamente la
minería de procesos como un nuevo método de investigación.
EQUIPO
Este proyecto fue desarrollado íntegramente en las instalaciones del ICO por un equipo
multidisciplinar compuesto por: un especialista en las estructuras de datos y sistemas de
información del ICO, una doctora del ICO especializada en oncología y un experto en análisis
de datos y Minería de Procesos de G2.
G2: Antonio Valle Salas ICO: Pau López García ICO: Lourdes Pétriz González
G2, Gobierno y Gestión de TI6
Acerca del ICO
El Institut Català d’Oncologia (ICO) es
un centro público que trabaja
exclusivamente en el campo del cáncer.
Su aproximación a la enfermedad es
complete, combinando dentro de la
misma organización prevención,
atención hospitalaria, investigación y
formación especializada. El ICO se creó
en 1995 por el Departament de Salut de
la Generalitat de Catalunya y es a día de
hoy el centro de referencia en oncología
para más del 40% de la población de
Catalunya.
Acerca de G2
G2 es una consultora especialista en el
gobierno y la gestión de servicios y
precios orientada a la mejora continua
de los mismos y a aumentar el valor que
éstos aportan al las organizaciones.
Fundad en 1998, G2 está reconocida
como líder en la aplicación de minería
de procesos en mil tiples ámbitos (TIC,
sanidad, administración…) así como en
el gobierno de las TIC y la gestión del
cambio organizativo en clientes de
todos los sectores de actividad.
Avd. Ernest Lluch, 32 - 08302 Mataró - Barcelona
Gobierno y Gestión de TI
http://www.gedos.es

Más contenido relacionado

La actualidad más candente

nantecnologia y medicina
nantecnologia y medicinanantecnologia y medicina
nantecnologia y medicina
andrestorresky1
 
Ensayo verano
Ensayo veranoEnsayo verano
Ensayo verano
Yun Téllez
 
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
QMS Comunicación
 
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
Juan de Dios Díaz Rosales
 
01. importancia de la citologia y papel del citotecnico
01. importancia de la citologia y papel del citotecnico01. importancia de la citologia y papel del citotecnico
01. importancia de la citologia y papel del citotecnico
Carmen Hidalgo Lozano
 
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
Edwin José Calderón Flores
 
LINFADENECTOMIA
LINFADENECTOMIA LINFADENECTOMIA
LINFADENECTOMIA
Monica Martinez
 
Genoma humano: diez años de expectativas que se empiezan a cumplir
Genoma humano: diez años de expectativas que se empiezan a cumplirGenoma humano: diez años de expectativas que se empiezan a cumplir
Genoma humano: diez años de expectativas que se empiezan a cumplir
raquelbiolog
 
Ratones fluorescentes y cáncer
Ratones fluorescentes y cáncerRatones fluorescentes y cáncer
Ratones fluorescentes y cáncer
Laprimeradetodas
 
Aplicaciones de inmunohistoquimica
Aplicaciones de inmunohistoquimicaAplicaciones de inmunohistoquimica
Aplicaciones de inmunohistoquimica
RamiQR
 
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
Gaspar Alberto Motta Ramírez
 
Trabajo santos2
Trabajo santos2Trabajo santos2
Trabajo santos2
Limber Villca
 
Linfadenectomia ca gastrico lap
Linfadenectomia ca gastrico  lapLinfadenectomia ca gastrico  lap
Linfadenectomia ca gastrico lap
Ricardo Yanez
 
Manejo Ca Vesical G3T1 y Refractario
Manejo Ca Vesical G3T1 y RefractarioManejo Ca Vesical G3T1 y Refractario
Manejo Ca Vesical G3T1 y Refractario
Uro Woller
 
Que es la histocitotecnologia
Que es la histocitotecnologiaQue es la histocitotecnologia
Que es la histocitotecnologia
CiraDeFreitas
 
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
Tessa Herondale
 
El mundo nano contra el cáncer.
El mundo nano contra el cáncer.El mundo nano contra el cáncer.
El mundo nano contra el cáncer.
Manuel De la rosa
 

La actualidad más candente (17)

nantecnologia y medicina
nantecnologia y medicinanantecnologia y medicina
nantecnologia y medicina
 
Ensayo verano
Ensayo veranoEnsayo verano
Ensayo verano
 
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
Información sobre proyectos y resultados de 2015 de la Fundación Cris contra ...
 
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
Pancreatitis aguda como manifestación clínica de tumor de células germinales ...
 
01. importancia de la citologia y papel del citotecnico
01. importancia de la citologia y papel del citotecnico01. importancia de la citologia y papel del citotecnico
01. importancia de la citologia y papel del citotecnico
 
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
TUMORES MALIGNOS SECUNDARIOS DE LA GLANDULA PAROTIDA: ¡NO ES UN PROBLEMA SECU...
 
LINFADENECTOMIA
LINFADENECTOMIA LINFADENECTOMIA
LINFADENECTOMIA
 
Genoma humano: diez años de expectativas que se empiezan a cumplir
Genoma humano: diez años de expectativas que se empiezan a cumplirGenoma humano: diez años de expectativas que se empiezan a cumplir
Genoma humano: diez años de expectativas que se empiezan a cumplir
 
Ratones fluorescentes y cáncer
Ratones fluorescentes y cáncerRatones fluorescentes y cáncer
Ratones fluorescentes y cáncer
 
Aplicaciones de inmunohistoquimica
Aplicaciones de inmunohistoquimicaAplicaciones de inmunohistoquimica
Aplicaciones de inmunohistoquimica
 
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
Estado del arte en la evaluación de las lesiones ocupativas focales urinarias.
 
Trabajo santos2
Trabajo santos2Trabajo santos2
Trabajo santos2
 
Linfadenectomia ca gastrico lap
Linfadenectomia ca gastrico  lapLinfadenectomia ca gastrico  lap
Linfadenectomia ca gastrico lap
 
Manejo Ca Vesical G3T1 y Refractario
Manejo Ca Vesical G3T1 y RefractarioManejo Ca Vesical G3T1 y Refractario
Manejo Ca Vesical G3T1 y Refractario
 
Que es la histocitotecnologia
Que es la histocitotecnologiaQue es la histocitotecnologia
Que es la histocitotecnologia
 
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
LA NUEVA ALTERNATIVA DEL MILENIO PARA COMBATIR EL CÁNCER.
 
El mundo nano contra el cáncer.
El mundo nano contra el cáncer.El mundo nano contra el cáncer.
El mundo nano contra el cáncer.
 

Similar a Caso de Estudio - Utilizando la Mineria de Procesos para la investigación en el cancer

Articulos
ArticulosArticulos
Articulos
julisan101
 
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
Gaspar Alberto Motta Ramírez
 
Futuro de la radiología en panamá y el mundo
Futuro de la radiología en panamá y el mundoFuturo de la radiología en panamá y el mundo
Futuro de la radiología en panamá y el mundo
DOCENCIA
 
Citologias.pdf
Citologias.pdfCitologias.pdf
Citologias.pdf
PaulaTorres542905
 
PC1 CITOLOGÍA.pdf
PC1 CITOLOGÍA.pdfPC1 CITOLOGÍA.pdf
PC1 CITOLOGÍA.pdf
BeckyBetsyBurgaGutie
 
Proyecto de word
Proyecto de wordProyecto de word
Proyecto de word
Marco Toriz
 
S8 aurora reyna_informe
S8 aurora reyna_informeS8 aurora reyna_informe
S8 aurora reyna_informe
aurora reyna
 
Càncer de Ano
Càncer de AnoCàncer de Ano
Càncer de Ano
Ivan Vojvodic Hernández
 
Las nuevas tecnologias en el diagnostico de enfermedades
Las nuevas tecnologias en el diagnostico de enfermedadesLas nuevas tecnologias en el diagnostico de enfermedades
Las nuevas tecnologias en el diagnostico de enfermedades
alexzbuap
 
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
Fòrum Català d’Informació i Salut
 
adenocarcinoma de pulmon.pdf
adenocarcinoma de pulmon.pdfadenocarcinoma de pulmon.pdf
adenocarcinoma de pulmon.pdf
SandyFlores28
 
Daniel2
Daniel2Daniel2
Medicamentos que transforman vidas
Medicamentos que transforman vidasMedicamentos que transforman vidas
Medicamentos que transforman vidas
Jose Josan
 
Futuro de la autopsia. José Hurtado de Mendoza Amat
Futuro de la autopsia. José Hurtado de Mendoza Amat Futuro de la autopsia. José Hurtado de Mendoza Amat
Futuro de la autopsia. José Hurtado de Mendoza Amat
Cátedra de Anatomía Patológica LUZ
 
La secuenciación del genoma humano revolucionó la biología
La secuenciación del genoma humano revolucionó la biologíaLa secuenciación del genoma humano revolucionó la biología
La secuenciación del genoma humano revolucionó la biología
leo
 
Daniel2
Daniel2Daniel2
Daniel2
Daniel2Daniel2
ONCOLOGIA
ONCOLOGIAONCOLOGIA
Revision de 105 casos de ecografía de mamaria (monografia)
Revision de 105 casos de ecografía de mamaria (monografia)Revision de 105 casos de ecografía de mamaria (monografia)
Revision de 105 casos de ecografía de mamaria (monografia)
Omar Guillermo Guillermo Henriquez
 
Ecografia en nodulo tiroideo 15 23
Ecografia en nodulo tiroideo 15 23Ecografia en nodulo tiroideo 15 23
Ecografia en nodulo tiroideo 15 23
Xavier Ruilova
 

Similar a Caso de Estudio - Utilizando la Mineria de Procesos para la investigación en el cancer (20)

Articulos
ArticulosArticulos
Articulos
 
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
Actualizaciones médico-quirúrgicas, un horizonte hacia la nueva normalidad.
 
Futuro de la radiología en panamá y el mundo
Futuro de la radiología en panamá y el mundoFuturo de la radiología en panamá y el mundo
Futuro de la radiología en panamá y el mundo
 
Citologias.pdf
Citologias.pdfCitologias.pdf
Citologias.pdf
 
PC1 CITOLOGÍA.pdf
PC1 CITOLOGÍA.pdfPC1 CITOLOGÍA.pdf
PC1 CITOLOGÍA.pdf
 
Proyecto de word
Proyecto de wordProyecto de word
Proyecto de word
 
S8 aurora reyna_informe
S8 aurora reyna_informeS8 aurora reyna_informe
S8 aurora reyna_informe
 
Càncer de Ano
Càncer de AnoCàncer de Ano
Càncer de Ano
 
Las nuevas tecnologias en el diagnostico de enfermedades
Las nuevas tecnologias en el diagnostico de enfermedadesLas nuevas tecnologias en el diagnostico de enfermedades
Las nuevas tecnologias en el diagnostico de enfermedades
 
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
Trabajo Final de Máster de Sistemas TIC de Salud de la Universitat Oberta de ...
 
adenocarcinoma de pulmon.pdf
adenocarcinoma de pulmon.pdfadenocarcinoma de pulmon.pdf
adenocarcinoma de pulmon.pdf
 
Daniel2
Daniel2Daniel2
Daniel2
 
Medicamentos que transforman vidas
Medicamentos que transforman vidasMedicamentos que transforman vidas
Medicamentos que transforman vidas
 
Futuro de la autopsia. José Hurtado de Mendoza Amat
Futuro de la autopsia. José Hurtado de Mendoza Amat Futuro de la autopsia. José Hurtado de Mendoza Amat
Futuro de la autopsia. José Hurtado de Mendoza Amat
 
La secuenciación del genoma humano revolucionó la biología
La secuenciación del genoma humano revolucionó la biologíaLa secuenciación del genoma humano revolucionó la biología
La secuenciación del genoma humano revolucionó la biología
 
Daniel2
Daniel2Daniel2
Daniel2
 
Daniel2
Daniel2Daniel2
Daniel2
 
ONCOLOGIA
ONCOLOGIAONCOLOGIA
ONCOLOGIA
 
Revision de 105 casos de ecografía de mamaria (monografia)
Revision de 105 casos de ecografía de mamaria (monografia)Revision de 105 casos de ecografía de mamaria (monografia)
Revision de 105 casos de ecografía de mamaria (monografia)
 
Ecografia en nodulo tiroideo 15 23
Ecografia en nodulo tiroideo 15 23Ecografia en nodulo tiroideo 15 23
Ecografia en nodulo tiroideo 15 23
 

Más de BPM Conference España

Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
BPM Conference España
 
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServerTINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
BPM Conference España
 
CHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
CHIEF: Herramienta para la Creación Automática de Procesos CoreografiadosCHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
CHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
BPM Conference España
 
Automatización del cálculo de los niveles de servicio mediante el análisis de...
Automatización del cálculo de los niveles de servicio mediante el análisis de...Automatización del cálculo de los niveles de servicio mediante el análisis de...
Automatización del cálculo de los niveles de servicio mediante el análisis de...
BPM Conference España
 
Analítica de negocio centrada en el comportamiento de los clientes en sistema...
Analítica de negocio centrada en el comportamiento de los clientes en sistema...Analítica de negocio centrada en el comportamiento de los clientes en sistema...
Analítica de negocio centrada en el comportamiento de los clientes en sistema...
BPM Conference España
 
El papel clave de los procesos en la necesaria Transformación Digital
El papel clave de los procesos en la necesaria Transformación DigitalEl papel clave de los procesos en la necesaria Transformación Digital
El papel clave de los procesos en la necesaria Transformación Digital
BPM Conference España
 
Descubriendo nuevas lineas de investigación mediante Mineria de procesos
Descubriendo nuevas lineas de investigación mediante Mineria de procesosDescubriendo nuevas lineas de investigación mediante Mineria de procesos
Descubriendo nuevas lineas de investigación mediante Mineria de procesos
BPM Conference España
 

Más de BPM Conference España (7)

Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
Análisis de procesos quirúrgicos mediante Process Mining y sistemas de locali...
 
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServerTINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
TINTIN A Tool for INcremental INTegrity checking of SQL assertions in SQLServer
 
CHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
CHIEF: Herramienta para la Creación Automática de Procesos CoreografiadosCHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
CHIEF: Herramienta para la Creación Automática de Procesos Coreografiados
 
Automatización del cálculo de los niveles de servicio mediante el análisis de...
Automatización del cálculo de los niveles de servicio mediante el análisis de...Automatización del cálculo de los niveles de servicio mediante el análisis de...
Automatización del cálculo de los niveles de servicio mediante el análisis de...
 
Analítica de negocio centrada en el comportamiento de los clientes en sistema...
Analítica de negocio centrada en el comportamiento de los clientes en sistema...Analítica de negocio centrada en el comportamiento de los clientes en sistema...
Analítica de negocio centrada en el comportamiento de los clientes en sistema...
 
El papel clave de los procesos en la necesaria Transformación Digital
El papel clave de los procesos en la necesaria Transformación DigitalEl papel clave de los procesos en la necesaria Transformación Digital
El papel clave de los procesos en la necesaria Transformación Digital
 
Descubriendo nuevas lineas de investigación mediante Mineria de procesos
Descubriendo nuevas lineas de investigación mediante Mineria de procesosDescubriendo nuevas lineas de investigación mediante Mineria de procesos
Descubriendo nuevas lineas de investigación mediante Mineria de procesos
 

Último

INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
YulEz1
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
Mayra798665
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
mirimerlos5
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
riveroarlett5b
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
MarcoPolo545324
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
IrapuatoCmovamos
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
GustavoTello19
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
christianllacchasand
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
agustincarranza11
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
eliassalascolonia43
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
DilmerCarranza
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
eleandroth
 

Último (14)

INTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdfINTELIGENCIA ARTIFICIAL monografia02.pdf
INTELIGENCIA ARTIFICIAL monografia02.pdf
 
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptxUGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
UGEL SAN MIGUEL SACALE TARJETA ROJA A LA VIOLENCIA.pptx
 
Informe fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docxInforme fina mini bibliotecacomunitaria .docx
Informe fina mini bibliotecacomunitaria .docx
 
resumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TIresumen de manual de organizacion y funciones de TI
resumen de manual de organizacion y funciones de TI
 
04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos04 capital interes simple.pdf de la clase métodos cuantitativos
04 capital interes simple.pdf de la clase métodos cuantitativos
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-MAYO 2024-IRAPUATO.pdf
 
MI CECTOR POSTE BLANCO - Paián .pdf
MI  CECTOR  POSTE  BLANCO - Paián   .pdfMI  CECTOR  POSTE  BLANCO - Paián   .pdf
MI CECTOR POSTE BLANCO - Paián .pdf
 
Plan Emergencia solicitado en obras de construccion
Plan Emergencia  solicitado en obras de construccionPlan Emergencia  solicitado en obras de construccion
Plan Emergencia solicitado en obras de construccion
 
Plan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdfPlan de Compensación Dxn Internacional peru pdf
Plan de Compensación Dxn Internacional peru pdf
 
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllllANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
ANA0003227-lagunas.pdfñlñlñlñlñññlñlllll
 
vivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodosvivienda segura concreto, construcción y métodos
vivienda segura concreto, construcción y métodos
 
Presentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptxPresentación simple corporativa degradado en violeta blanco.pptx
Presentación simple corporativa degradado en violeta blanco.pptx
 

Caso de Estudio - Utilizando la Mineria de Procesos para la investigación en el cancer

  • 1. Minería de Procesos Descubriendo nuevas líneas de investigación para Profesionales de las TIC de Antonio Valle Salas 4 novembre de 2016 The Critical Need of Value
  • 2. MINERÍA DE PROCESOS Descubriendo nuevas líneas de investigación de las neoplasias mediante minería de procesos RESUMEN En este proyecto G2, junto con un equipo de investigación del Institut Català d’Oncologia, analizó mediante técnicas de Minería de Procesos la evolución de los pacientes que han sufrido múltiples episodios de cáncer. Los resultados fueron sorprendentes: utilizar estas técnicas permitió a los investigadores tener una visión temporal de las neoplasias, visualizar claramente los patrones de aparición de segundos y sucesivos tumores y descubrir relaciones y comportamientos de las neoplasias que hasta el momento del estudio no estaban claros. PROYECTO La Minería de Procesos se puede utilizar para el análisis de cualquier tipo de información en la que se produzca un cambio en el tiempo. El ICO lleva desde el año 2005 realizando una investigación detallada sobre la aparición y evolución de siete tipos distintos de tumores cancerígenos: Colo-Rectal, Pulmón, Mama, Leucemia, Linfoma, Mieloma y Sistema Nervioso Central. Durante este periodo se ha recopilado información detallada sobre la aparición de cada una de las neoplasias. Los equipos de investigación buscan patrones y relaciones entre la aparición del primer, el segundo y los sucesivos tumores en un paciente que les permitan establecer nuevos protocolos de monitorización de los pacientes: una detección temprana aumenta en gran medida las posibilidades de su supervivencia y su calidad de vida. Así, se plantearon al equipo de proyecto tres retos: a) ¿Cuáles son los patrones fundamentales que sigue la aparición de neoplasias sucesivas? ¿Existen relaciones que no estén descritas y que puedan servir como punto de partida de nuevas líneas de investigación? b) ¿Podemos representar un mapa que sirva de guía y de herramienta de comunicación para que los médicos de atención primaria estén alerta ante los síntomas o señales que se muestran en la aparición de cáncer sucesivo? c) Paralelamente y de forma adicional, ¿podríamos generar algún material de comunicación que nos permita tener una visión temporal de la evolución de los pacientes? G2, Gobierno y Gestión de TI 1
  • 3. Descubriendo nuevas líneas de investigación G2 propuso utilizar la solución Disco, del fabricante holandés Fluxicon, para llevar a cabo los análisis de los datos mediante técnicas de minería de procesos, por la gran agilidad y usabilidad en los análisis que proporciona Disco. DATOS Para realizar este análisis se extrajeron de los sistemas de información del ICO los datos sobre la aparición de tumores en forma de event log, en el que cada evento representa un tumor y cada caso un paciente; la información sobre tumores venía enriquecida con aspectos clínicos y demográficos tanto del paciente (sexo, edad, etc.) como del tumor (clasificación, aspectos clínicos, etc.) La extracción de los datos se realizó utilizando las herramientas y el datawarehouse que ya existían en la organización: un sistema de almacenamiento y ETL basado en Kettle ya integrado con la información de los sistemas operacionales y que es utilizado en las tareas de investigación y reporting. La existencia previa de esta información y de este sistema ETL facilitó enormemente la tarea, ya que no hubo que realizar esfuerzos especialmente importantes en la extracción de datos. El event log a analizar se componía de 3800 casos y 4782 eventos y unas primeras comprobaciones permitieron descubrir que el grado de calidad de los datos era excelente: apenas un 0,21% de los casos contenían errores, los cuales fueron detectados rápidamente con Disco. Después de verificar la información en los sistemas operacionales, el equipo encontró que los errores se correspondían a casos duplicados en los sistemas de origen y a errores de apreciación en la historia clínica, errores que fueron corregidos en el origen antes de repetir la exportación de datos a Disco. El siguiente reto con el que nos encontramos fue con la necesidad de agrupar los tumores por categorías: la primera extracción de datos contenía gran cantidad de actividades (462) debido al nivel de detalle con el que se clasifican los tumores en la historia clínica. Con ayuda de la oncóloga del equipo se asignó a cada una de estas actividades una categoría que nos permitía agrupar los tumores objeto del estudio en los 7 grandes grupos mencionados en la introducción, reduciendo el número de actividades a 19. G2, Gobierno y Gestión de TI2 Fig. 1 Secuencia de neoplasis que muestra problemas de calidad de los datos: ¿5 pacientes empiezan con el “segundo” tumor?
  • 4. MINERÍA DE PROCESOS Así, por ejemplo, se asignó la categoría “Mama” a los tumores clasificados como “Cuadrante inferior interno de la mama” o “Cuadrante superior interno de la mama” o “Prolongación Axilar de la mama”. Una vez que ya disponíamos del dataset correcto se aplicó un filtro para descartar todos aquellos casos que habían padecido un único tumor, ya que el estudio se debía centrar en los casos múltiples dejando la muestra reducida a 792 casos (pacientes), 1776 eventos (tumores) y 19 actividades (tipologías de tumor). RESULTADOS El proceso de análisis fue muy intenso, con todo el equipo presente durante los dos días que dedicamos a explorar la información proporcionada. Rápidamente las técnicas de Minería de Procesos se ganaron la confianza y el respeto de los miembros del ICO. La primera representación fue, como cabía esperar, un diagrama de espaguetis por lo que, liderados por la oncóloga del equipo, pasamos a realizar varias representaciones de las diferentes casuísticas según nos lo iba pidiendo. La primera comprobación fue un diagrama de supervivencia (figura 2). En él se puede observar claramente cómo el 69,45% de los pacientes analiza do s sobrevive al primer tumor; un 60,6% sobrevive al segundo y un 63,4% lo hace al tercero: una información que el equipo de investigación ya conocía, pero q u e a l s e r re p re s e n t a d a gráficamente ganaba un gran peso como herramienta de comunicación médica. Por otra parte, explorar un terreno conocido sirvió para afianzar la confianza en las nuevas técnicas empleadas. Para explorar diferentes maneras de representar los patrones que presentan los datos utilizamos una representación de mapa filtrado (mostrando los casos que se iniciaban con cualquiera de los 7 tipos de neoplasia objeto de la investigación), la representación de las variantes que proporciona Disco y el visualizador “Explore Event Log (trace variants)”. G2, Gobierno y Gestión de TI 3 Fig. 2 Diagrama de secuencia y supervivencia
  • 5. Descubriendo nuevas líneas de investigación De esta manera, la representación de mapa de Disco cubría todos los objetivos del estudio. Por ejemplo, la figura. 3 muestra cómo los pacientes que han sufrido un primer episodio de cáncer de mama y que posteriormente presentan un segundo tumor o sucesivo presentan mayor probabilidad de desarrollar un segundo tumor de mama que otros tipos de tumores. Por otra parte, al analizar las variantes mediante el visualizador de ProM (figura 4), se descubrió la fuerte relación que había entre las tipologías Pulmón y CCR (Colo-Rectal), haciendo aflorar un patrón que hasta el momento había permanecido oculto y que servirá para abrir líneas de investigación en el futuro. G2, Gobierno y Gestión de TI4 Fig. 3 Patrones en el cáncer de mama Fig. 4 Patrones / Variantes en ProM
  • 6. MINERÍA DE PROCESOS Una vez detectada esta relación, se filtraron los casos en Disco para obtener una visión más ajustada y se pudo observar que aproximadamente un 9% de los casos presentan ambos tipos de neoplasia, tal y como podemos ver en la figura 5. BENEFICIOS Este proyecto ha generado beneficios importantes en diferentes perspectivas: En el equipo de investigación del ICO: El equipo de investigación del ICO ha podido comprobar en primera instancia las ventajas que proporciona la minería de procesos para aportar nuevas perspectivas del estudio de la información. Los nuevos métodos de estudio y representación de la información abren puertas a nuevas ideas y avances en la investigación. En la manera de presentar la información: En general los estudios que se han venido realizando en el ámbito de la Oncología en Catalunya están fuertemente ligados a métodos estadísticos o de diagnóstico por la imagen. La nueva forma de visualizar el flujo de los tumores ha sido relevante, y usar gráficas de variantes en ProM o animaciones de Disco ha sido determinante para ganar la atención del resto de equipos de investigación. En la práctica de minería de procesos: Este ha sido el primer caso de aplicación de la minería de procesos a la investigación de la evolución de tumores. Había bastantes referencias del uso de la minería de procesos en el sector salud, pero siempre orientado al flujo o a la gestión hospitalaria y no a la investigación de enfermedades. En la presentación de resultados a la sociedad: Durante los días 21 y 22 de Abril de 2016 se llevó a cabo el simposio ICO 10mes10 en el que el ICO presentaba los resultados de sus 20 años de actividad a la sociedad. G2, Gobierno y Gestión de TI 5 Fig. 5 Relación entre Pulmón y CCP.
  • 7. Descubriendo nuevas líneas de investigación Entre los más de 500 asistentes al simposio se encontraban los médicos e investigadores más relevantes de Catalunya. La única conferencia que se repitió los dos días del congreso fue la dictada por el Dr. José Ramón Germà presentando los resultados de los análisis de supervivencia en los siete tumores analizados (demostrando que la supervivencia en Catalunya es la más alta del mundo); durante esa conferencia, el Dr. Germà proyectó un video mostrando las animaciones realizadas con Disco y mencionando específicamente la minería de procesos como un nuevo método de investigación. EQUIPO Este proyecto fue desarrollado íntegramente en las instalaciones del ICO por un equipo multidisciplinar compuesto por: un especialista en las estructuras de datos y sistemas de información del ICO, una doctora del ICO especializada en oncología y un experto en análisis de datos y Minería de Procesos de G2. G2: Antonio Valle Salas ICO: Pau López García ICO: Lourdes Pétriz González G2, Gobierno y Gestión de TI6 Acerca del ICO El Institut Català d’Oncologia (ICO) es un centro público que trabaja exclusivamente en el campo del cáncer. Su aproximación a la enfermedad es complete, combinando dentro de la misma organización prevención, atención hospitalaria, investigación y formación especializada. El ICO se creó en 1995 por el Departament de Salut de la Generalitat de Catalunya y es a día de hoy el centro de referencia en oncología para más del 40% de la población de Catalunya. Acerca de G2 G2 es una consultora especialista en el gobierno y la gestión de servicios y precios orientada a la mejora continua de los mismos y a aumentar el valor que éstos aportan al las organizaciones. Fundad en 1998, G2 está reconocida como líder en la aplicación de minería de procesos en mil tiples ámbitos (TIC, sanidad, administración…) así como en el gobierno de las TIC y la gestión del cambio organizativo en clientes de todos los sectores de actividad.
  • 8. Avd. Ernest Lluch, 32 - 08302 Mataró - Barcelona Gobierno y Gestión de TI http://www.gedos.es