SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
1er mars 2016
Dr Alain Livartowski - Julien Guérin 23 mai 2017
1
Innovation dans le traitement
des données
Big Data
Données non structurées
Images
Données de séquençage
Data
Biométrie
Statistique
« classique »
?
Un océan de données
3Institut Curie – Alain Livartowski - Julien Guérin
PMSI
Bases de
données
Elios NG
> 460.000 patients
> 10 M documents
> 400 M concepts
Fiche tumeur
> 250.000
Traitements
Chimio
Chirurgie
Radiothérapie
Immuno
Images
> 100 TB de données
Données
Biologiques
CRB
> 500.000
Échantillons
Cryopréservés
Big data et cancer
Données « en vie réelle »
Pas de sélection de population
Concerne 85 % + 15 % des patients
Les limites peuvent-elles être repoussées ?
Adapté aux maladies rares
Nombre très grand de variables étudiées
Contrôle des biais
Pour quelles retombées ?
Prélèvements Séquençage CAD
Variant call File
Utiliser toutes les données disponibles
Données cliniques
Images
Données structurées
radiologiques
Anatomo-pathologiques
(VCF)
Données textuelles
Textes
Images
Données
structurées
Etape 1 – entrepôt de données
Autres :
Ex : NGS
Modélisation
Données
inférées ou
calculées
Contrôle qualité
Etape 2
The main steps
8Institut Curie – Alain Livartowski and Julien Guérin 29 May 2017
Modelize Build Integrate
Analyze
And Share
Neoplasm
Primary
Neoplasm
Relapse Metastatic
relapse
Co-morbidity and Adverse Events
Related diseases
Antecedents and
Risk Factors
T0
Patient history
DRG
Demogra
phics
Drugs EHR
Tumor
caracter
istics
Biobanks
6 datasources
7 standards : CIM-10, CIM-O-3, ADICAP, SNOMED 3.5, COSMIC, CCAM, Vidal
Extraction & Transformation Annotation Inference Publication
Enrich
ConSoRe
Continuum Soins Recherche
ConSoRe
Institut Curie – Julien Guérin – ConSoRe : accelerating the continuum bench to bedside 14
Files
parsing
Extracting
metadata
Extracting
concepts
(Temis
Luxid)
Enrichment Transformation
Search
engine
indexation
RDF
generation
Triplestore
injection
Enrichment with
SparQL rules
ConSoRe
Continuum Soins Recherche
ConSoRe +
Continuum Soins Recherche
De ConSoRe à ConSoRe+
Data
sources
(XML)
29 mai 2017
Etape 3 – analyse des données
Données Technique analyse Hypothèse/connaissance
NLP/NLU
IA
ML/DL
cas similaires
cancer et thrombose
co-médication
16
Le traitement automatique du langage naturel
Kusnet et al. 2015
Etape 4 – monter des projets mutli-centriques
co-médication
Cancer du sein et
leucémies induites
Disposer d’une liste de patients, de tumeurs, de spécimens biologiques sur
critères et extraire une information structurée
Aide au diagnostic, prédire l’évolution (avec un indice de confiance)
Aider la recherche, la recherche clinique, l’inclusion dans les essais
Trouver des « cas similaires », chez moi, dans mon entourage, ailleurs
Aider le quotidien : préparation des RCP, synthèse automatique,
Aider le patient à distance : eSanté, recueil des signes et symptômes,
Analyse automatique des images, des textes, des données génomiques
Alerte sanitaire, pharmaco-vigilance, matério-vigilance, épidémiologie
Données de la « vraie vie », de l’environnement, consommation médicamenteuse
Etc.

Más contenido relacionado

Similar a Innovation dans le traitement des données / Alain Livartowski et Julien Guérin

Presentation_ComPaRe.pptx
Presentation_ComPaRe.pptxPresentation_ComPaRe.pptx
Presentation_ComPaRe.pptxAmah KOUEVI
 
Présentation du PAIR pédiatrie - André Baruchel
Présentation du PAIR pédiatrie - André BaruchelPrésentation du PAIR pédiatrie - André Baruchel
Présentation du PAIR pédiatrie - André BaruchelInstitut national du cancer
 
Presentation du vocabulaire MeSH
Presentation du vocabulaire MeSHPresentation du vocabulaire MeSH
Presentation du vocabulaire MeSHcedocel
 
Tic Sante 2010 02 10 Perinice
Tic Sante 2010 02 10 PeriniceTic Sante 2010 02 10 Perinice
Tic Sante 2010 02 10 Perinicealilou2955
 
Neurochirurgie ambulatoire
Neurochirurgie ambulatoire Neurochirurgie ambulatoire
Neurochirurgie ambulatoire Michel Triffaux
 
La recherche en Imagerie Ostéo-articulaire
La recherche en Imagerie Ostéo-articulaireLa recherche en Imagerie Ostéo-articulaire
La recherche en Imagerie Ostéo-articulaireRéseau Pro Santé
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Alberto González-Talaván
 
Neurochirurgie ambulatoire CUMG Pipaix 2017
Neurochirurgie ambulatoire CUMG Pipaix 2017Neurochirurgie ambulatoire CUMG Pipaix 2017
Neurochirurgie ambulatoire CUMG Pipaix 2017Michel Triffaux
 
Tircel Fave Tic Vf
Tircel Fave Tic VfTircel Fave Tic Vf
Tircel Fave Tic Vfalilou2955
 
6ème Journée Innov'Asso
6ème Journée Innov'Asso6ème Journée Innov'Asso
6ème Journée Innov'AssoInnov'Asso
 
Incidental findings throughout multigene panel testing in cancer genetics
Incidental findings throughout multigene panel testing in cancer geneticsIncidental findings throughout multigene panel testing in cancer genetics
Incidental findings throughout multigene panel testing in cancer geneticsPasteur_Tunis
 
Genopole, aujourd’hui et demain
Genopole, aujourd’hui et demainGenopole, aujourd’hui et demain
Genopole, aujourd’hui et demainGenopole
 
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du Sein
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du SeinPr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du Sein
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du SeinGustave Roussy
 
Apports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiquesApports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiquesPhilippe GORRY
 

Similar a Innovation dans le traitement des données / Alain Livartowski et Julien Guérin (20)

Presentation_ComPaRe.pptx
Presentation_ComPaRe.pptxPresentation_ComPaRe.pptx
Presentation_ComPaRe.pptx
 
Quand l'intelligence artificielle s'invite au bloc opératoire Eric VIbert.pdf
Quand l'intelligence artificielle s'invite au bloc opératoire Eric VIbert.pdfQuand l'intelligence artificielle s'invite au bloc opératoire Eric VIbert.pdf
Quand l'intelligence artificielle s'invite au bloc opératoire Eric VIbert.pdf
 
Présentation du PAIR pédiatrie - André Baruchel
Présentation du PAIR pédiatrie - André BaruchelPrésentation du PAIR pédiatrie - André Baruchel
Présentation du PAIR pédiatrie - André Baruchel
 
Presentation du vocabulaire MeSH
Presentation du vocabulaire MeSHPresentation du vocabulaire MeSH
Presentation du vocabulaire MeSH
 
Tic Sante 2010 02 10 Perinice
Tic Sante 2010 02 10 PeriniceTic Sante 2010 02 10 Perinice
Tic Sante 2010 02 10 Perinice
 
Senonov
SenonovSenonov
Senonov
 
Évaluer l'information sur Internet et prescrire des ressources aux patients- ...
Évaluer l'information sur Internet et prescrire des ressources aux patients- ...Évaluer l'information sur Internet et prescrire des ressources aux patients- ...
Évaluer l'information sur Internet et prescrire des ressources aux patients- ...
 
Neurochirurgie ambulatoire
Neurochirurgie ambulatoire Neurochirurgie ambulatoire
Neurochirurgie ambulatoire
 
La recherche en Imagerie Ostéo-articulaire
La recherche en Imagerie Ostéo-articulaireLa recherche en Imagerie Ostéo-articulaire
La recherche en Imagerie Ostéo-articulaire
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
 
Anniversaire de L'institut des Vaisseaux et du Sang (IVS)
Anniversaire de L'institut des Vaisseaux et du Sang (IVS)Anniversaire de L'institut des Vaisseaux et du Sang (IVS)
Anniversaire de L'institut des Vaisseaux et du Sang (IVS)
 
Neurochirurgie ambulatoire CUMG Pipaix 2017
Neurochirurgie ambulatoire CUMG Pipaix 2017Neurochirurgie ambulatoire CUMG Pipaix 2017
Neurochirurgie ambulatoire CUMG Pipaix 2017
 
Tircel Fave Tic Vf
Tircel Fave Tic VfTircel Fave Tic Vf
Tircel Fave Tic Vf
 
6ème Journée Innov'Asso
6ème Journée Innov'Asso6ème Journée Innov'Asso
6ème Journée Innov'Asso
 
UE ISSM 7.309 GCF2018bis
UE ISSM 7.309 GCF2018bisUE ISSM 7.309 GCF2018bis
UE ISSM 7.309 GCF2018bis
 
Incidental findings throughout multigene panel testing in cancer genetics
Incidental findings throughout multigene panel testing in cancer geneticsIncidental findings throughout multigene panel testing in cancer genetics
Incidental findings throughout multigene panel testing in cancer genetics
 
Genopole, aujourd’hui et demain
Genopole, aujourd’hui et demainGenopole, aujourd’hui et demain
Genopole, aujourd’hui et demain
 
Vita dx dp-vf
Vita dx dp-vfVita dx dp-vf
Vita dx dp-vf
 
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du Sein
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du SeinPr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du Sein
Pr Fabrice André - Parrainage Chercheur Gustave Roussy - Cancer du Sein
 
Apports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiquesApports de la scientométrie à l’étude des découvertes scientifiques
Apports de la scientométrie à l’étude des découvertes scientifiques
 

Más de pwod

Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...pwod
 
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...pwod
 
Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...pwod
 
SEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien MonnierSEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien Monnierpwod
 
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...pwod
 
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...pwod
 
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...pwod
 
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...pwod
 
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...pwod
 
You tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas LehuenYou tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas Lehuenpwod
 

Más de pwod (10)

Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
 
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
 
Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...
 
SEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien MonnierSEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien Monnier
 
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
 
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
 
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
 
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
 
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
 
You tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas LehuenYou tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas Lehuen
 

Innovation dans le traitement des données / Alain Livartowski et Julien Guérin

  • 1. 1er mars 2016 Dr Alain Livartowski - Julien Guérin 23 mai 2017 1 Innovation dans le traitement des données
  • 2. Big Data Données non structurées Images Données de séquençage Data Biométrie Statistique « classique » ?
  • 3. Un océan de données 3Institut Curie – Alain Livartowski - Julien Guérin PMSI Bases de données Elios NG > 460.000 patients > 10 M documents > 400 M concepts Fiche tumeur > 250.000 Traitements Chimio Chirurgie Radiothérapie Immuno Images > 100 TB de données Données Biologiques CRB > 500.000 Échantillons Cryopréservés
  • 4. Big data et cancer Données « en vie réelle » Pas de sélection de population Concerne 85 % + 15 % des patients Les limites peuvent-elles être repoussées ? Adapté aux maladies rares Nombre très grand de variables étudiées Contrôle des biais Pour quelles retombées ?
  • 5. Prélèvements Séquençage CAD Variant call File Utiliser toutes les données disponibles Données cliniques Images Données structurées radiologiques Anatomo-pathologiques (VCF) Données textuelles
  • 6. Textes Images Données structurées Etape 1 – entrepôt de données Autres : Ex : NGS
  • 8. The main steps 8Institut Curie – Alain Livartowski and Julien Guérin 29 May 2017 Modelize Build Integrate Analyze And Share Neoplasm Primary Neoplasm Relapse Metastatic relapse Co-morbidity and Adverse Events Related diseases Antecedents and Risk Factors T0 Patient history
  • 9.
  • 10.
  • 11.
  • 12.
  • 13. DRG Demogra phics Drugs EHR Tumor caracter istics Biobanks 6 datasources 7 standards : CIM-10, CIM-O-3, ADICAP, SNOMED 3.5, COSMIC, CCAM, Vidal Extraction & Transformation Annotation Inference Publication Enrich ConSoRe Continuum Soins Recherche
  • 14. ConSoRe Institut Curie – Julien Guérin – ConSoRe : accelerating the continuum bench to bedside 14 Files parsing Extracting metadata Extracting concepts (Temis Luxid) Enrichment Transformation Search engine indexation RDF generation Triplestore injection Enrichment with SparQL rules ConSoRe Continuum Soins Recherche ConSoRe + Continuum Soins Recherche De ConSoRe à ConSoRe+ Data sources (XML) 29 mai 2017
  • 15. Etape 3 – analyse des données Données Technique analyse Hypothèse/connaissance NLP/NLU IA ML/DL cas similaires cancer et thrombose co-médication
  • 16. 16 Le traitement automatique du langage naturel Kusnet et al. 2015
  • 17. Etape 4 – monter des projets mutli-centriques co-médication Cancer du sein et leucémies induites
  • 18. Disposer d’une liste de patients, de tumeurs, de spécimens biologiques sur critères et extraire une information structurée Aide au diagnostic, prédire l’évolution (avec un indice de confiance) Aider la recherche, la recherche clinique, l’inclusion dans les essais Trouver des « cas similaires », chez moi, dans mon entourage, ailleurs Aider le quotidien : préparation des RCP, synthèse automatique, Aider le patient à distance : eSanté, recueil des signes et symptômes, Analyse automatique des images, des textes, des données génomiques Alerte sanitaire, pharmaco-vigilance, matério-vigilance, épidémiologie Données de la « vraie vie », de l’environnement, consommation médicamenteuse Etc.