SlideShare una empresa de Scribd logo
1 de 19
Comment intégrer les termino-ontologies de
santé dans le web de données
Julien Grosjean, PhD
TIBS, LITIS Lab
Rouen University Hospital & Rouen Medical School, Normandy University, France
LIMICS, INSERM U1142
julien.grosjean@chu-rouen.fr
Les SOC
• Les classifications  vocabulaires
contrôlés (ou lexiques) structurés
• Depuis l’antiquité, évolution des
classifications en même temps que
la connaissance
• Fort intérêt depuis la fin du
XVIIIème siècle avec la classification
scientifique des espèces puis grand
développement jusqu’à nos jours
Ontologie
Terminologie
Thesaurus
Nomenclature
Taxinomie
Dictionnaire
Lexique
Liste
complexité
Les principaux Systèmes
d’Organisation des Connaissances
(SOCs)
Les SOC
• Représenter l’information
• Stocker
• Décrire
• Structurer
• Annoter
• Rechercher l’information
• Indexation / codage
• Inférer des faits
• Règles
• Raisonnement
• Subsomption
Les Systèmes Multi-SOC
(académiques)
• UMLS (USA)
• BioPortal (USA) -> instance
francophone LIRMM
• Ontology Lookup Service (UK)
• LexGrid / NCI Term browser (USA)
• HeTOP (France)
Standards?
• Quel normes ? ISO 25964, …
• Quels formats ? SKOS, OWL, RDF, … ?
• Quels modèles ?
• Quel formalisme ?
• Quels outils de gestion ? CTS2, … ?
• …
BioPortal
• Standford (M. Musen)
• https://bioportal.bioontology.org/
• 560 SOCs en anglais
• Entrepôt RDF
• Politique de téléversements (« one-stop shop »)
• LE serveur « open-data »
• Version francophone au LIRMM (C. Jonquet) :
http://bioportal.lirmm.fr/
• Attention : ontology vs ontology…
« The world’s most comprehensive repository of biomedical ontologies »
HeTOP
• CHU de Rouen – CISMeF / LIMICS (S. J. Darmoni)
• www.hetop.eu
• 75 SOC, plusieurs langues, orienté français/anglais
• Non ouvert
• Politique d’intégration et d’édition
• Méta-modèle et graphe de données
• Travail sur le fond et la forme
Interopérabilité
MeSH
SNOMED
int.
NCIT
HRDO
HPO
CIM-10
• Interopérabilité des SOCs et réseaux sémantiques
• Mai 2017 : 314 000 alignements supervisés, 58 000 manuels
HeTOP generic model
• Compatible avec les recommandations de Tao et al. (2013)
Validation
Ontology tools
Méthodologie d’intégration
Raw data
DB
Parsers
Model
OWL instance
Format
De la connaissance
De la connaissance
Pour la pratique
Vers une pratique en web de données…
http://www.hetop.fr/hetop/?la=es&r
r=CGP_QC_QD33
Navigation contextuelle
Semantic Web platform
Clinical Data
Warehouse
N = 109 medical
concepts
WEB
Bibliographic
metadata providers
Terminology
providers
Etc.
Clinical
data
Omic
data
French-speaking
article citations
N = 880,000
Freely available
French-speaking
resources
N = 117,000
Health terminologies
N = 75
2.3 millions concepts
Mappings &
translations
ECMT
MT@HeTOP
InfoRoute
indexation
2007
1995
2012
2010
Master M2IBM – Lina Soualmia & Catherine Duclos – LIM&Bio, UFR SMBH, Paris XIII
• Hétérogénéité :
• Formelle
• En qualité
• En couverture
• Versionnage et historisation
• Les licences ?
• Pérennité et validité des URIs ?
• Comment uniformiser ?
Limites
Merci
Questions
julien.grosjean@chu-rouen.fr

Más contenido relacionado

La actualidad más candente

Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
Politique Open Access de la Commission et de l'ERC : quelle application en Fr...Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
Jean-François Lutz
 

La actualidad más candente (11)

L'UOH aux Terrasses du Numérique, Université de Strasbourg
L'UOH  aux Terrasses du Numérique, Université de StrasbourgL'UOH  aux Terrasses du Numérique, Université de Strasbourg
L'UOH aux Terrasses du Numérique, Université de Strasbourg
 
Ontology Repository and Ontology-based Services
Ontology Repository and Ontology-based ServicesOntology Repository and Ontology-based Services
Ontology Repository and Ontology-based Services
 
Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
Politique Open Access de la Commission et de l'ERC : quelle application en Fr...Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
Politique Open Access de la Commission et de l'ERC : quelle application en Fr...
 
RDA : le nouveau paradigme du catalogage (4). Adopter RDA en France ?
RDA : le nouveau paradigme du catalogage (4). Adopter RDA en France ?RDA : le nouveau paradigme du catalogage (4). Adopter RDA en France ?
RDA : le nouveau paradigme du catalogage (4). Adopter RDA en France ?
 
F gouzi carnetiers2014
F gouzi carnetiers2014F gouzi carnetiers2014
F gouzi carnetiers2014
 
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
 
Sp6 Yann Nicolas
Sp6 Yann NicolasSp6 Yann Nicolas
Sp6 Yann Nicolas
 
Open Access scientific Literature
Open Access scientific LiteratureOpen Access scientific Literature
Open Access scientific Literature
 
Présentation HAL par Odile Contat - MESHS Lille 2015
Présentation HAL par Odile Contat - MESHS Lille 2015 Présentation HAL par Odile Contat - MESHS Lille 2015
Présentation HAL par Odile Contat - MESHS Lille 2015
 
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...
Jabes 2011 - Session plénière 18 mai "Politique du CNRS en information scient...
 
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
 

Similar a Comment intégrer les termino-ontologies de santé dans le web des données / Julien Grosjean

Similar a Comment intégrer les termino-ontologies de santé dans le web des données / Julien Grosjean (20)

SIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophonesSIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophones
 
SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminolog...
SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminolog...SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminolog...
SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminolog...
 
Recherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesRecherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponibles
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
20111128rechercheinfo_slsh
20111128rechercheinfo_slsh20111128rechercheinfo_slsh
20111128rechercheinfo_slsh
 
Big Data et Technologies du Langage
Big Data et Technologies du LangageBig Data et Technologies du Langage
Big Data et Technologies du Langage
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
ontologie de capteurs
ontologie de capteursontologie de capteurs
ontologie de capteurs
 
Jabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.frJabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.fr
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives L’internet des sciences humaines et sociales. Recherches - Perspectives
L’internet des sciences humaines et sociales. Recherches - Perspectives
 
Initiation aux outils et méthodes bibliométriques pour la recherche en droit
Initiation aux outils et méthodes bibliométriques pour la recherche en droitInitiation aux outils et méthodes bibliométriques pour la recherche en droit
Initiation aux outils et méthodes bibliométriques pour la recherche en droit
 
ED VAS 2016 Pour une recherche bibliographique efficace
ED VAS 2016 Pour une recherche bibliographique efficaceED VAS 2016 Pour une recherche bibliographique efficace
ED VAS 2016 Pour une recherche bibliographique efficace
 
Odonto s4
Odonto s4Odonto s4
Odonto s4
 
Odonto s4
Odonto s4Odonto s4
Odonto s4
 
Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010
 
Ontologies et Web 2.0 : une Expérimentation en Entreprise
Ontologies et Web 2.0 : une Expérimentation en EntrepriseOntologies et Web 2.0 : une Expérimentation en Entreprise
Ontologies et Web 2.0 : une Expérimentation en Entreprise
 
Cours eleves sages femmes
Cours eleves sages femmesCours eleves sages femmes
Cours eleves sages femmes
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 

Más de pwod

Más de pwod (10)

Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
Référentiels des examens biologiques et anatomocytopathologiques (ACP) et ope...
 
Innovation dans le traitement des données / Alain Livartowski et Julien Guérin
Innovation dans le traitement des données / Alain Livartowski et Julien GuérinInnovation dans le traitement des données / Alain Livartowski et Julien Guérin
Innovation dans le traitement des données / Alain Livartowski et Julien Guérin
 
Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...Intégration et exploration des bases de données médico-administratives grâce ...
Intégration et exploration des bases de données médico-administratives grâce ...
 
SEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien MonnierSEO et données structurées / Sébastien Monnier
SEO et données structurées / Sébastien Monnier
 
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
Contribuer à schema.org - Retour d’expérience : extension ELI pour les lois ...
 
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
Contexte agrégateur et distributeur d’annonces de voitures d’occasion en Am...
 
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
Une plateforme sémantique innovante offrant aux visiteurs l’ensemble des inf...
 
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
Collecte et interconnexion des données, référentiels / Cécile Cecconi & Rapha...
 
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
Usages et pratiques de l’écoute musicale dans le contexte numérique / Dominiq...
 
You tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas LehuenYou tube & the knowledge graph Nicolas Lehuen
You tube & the knowledge graph Nicolas Lehuen
 

Comment intégrer les termino-ontologies de santé dans le web des données / Julien Grosjean

  • 1. Comment intégrer les termino-ontologies de santé dans le web de données Julien Grosjean, PhD TIBS, LITIS Lab Rouen University Hospital & Rouen Medical School, Normandy University, France LIMICS, INSERM U1142 julien.grosjean@chu-rouen.fr
  • 2. Les SOC • Les classifications  vocabulaires contrôlés (ou lexiques) structurés • Depuis l’antiquité, évolution des classifications en même temps que la connaissance • Fort intérêt depuis la fin du XVIIIème siècle avec la classification scientifique des espèces puis grand développement jusqu’à nos jours Ontologie Terminologie Thesaurus Nomenclature Taxinomie Dictionnaire Lexique Liste complexité Les principaux Systèmes d’Organisation des Connaissances (SOCs)
  • 3. Les SOC • Représenter l’information • Stocker • Décrire • Structurer • Annoter • Rechercher l’information • Indexation / codage • Inférer des faits • Règles • Raisonnement • Subsomption
  • 4. Les Systèmes Multi-SOC (académiques) • UMLS (USA) • BioPortal (USA) -> instance francophone LIRMM • Ontology Lookup Service (UK) • LexGrid / NCI Term browser (USA) • HeTOP (France)
  • 5. Standards? • Quel normes ? ISO 25964, … • Quels formats ? SKOS, OWL, RDF, … ? • Quels modèles ? • Quel formalisme ? • Quels outils de gestion ? CTS2, … ? • …
  • 6. BioPortal • Standford (M. Musen) • https://bioportal.bioontology.org/ • 560 SOCs en anglais • Entrepôt RDF • Politique de téléversements (« one-stop shop ») • LE serveur « open-data » • Version francophone au LIRMM (C. Jonquet) : http://bioportal.lirmm.fr/ • Attention : ontology vs ontology… « The world’s most comprehensive repository of biomedical ontologies »
  • 7. HeTOP • CHU de Rouen – CISMeF / LIMICS (S. J. Darmoni) • www.hetop.eu • 75 SOC, plusieurs langues, orienté français/anglais • Non ouvert • Politique d’intégration et d’édition • Méta-modèle et graphe de données • Travail sur le fond et la forme
  • 8. Interopérabilité MeSH SNOMED int. NCIT HRDO HPO CIM-10 • Interopérabilité des SOCs et réseaux sémantiques • Mai 2017 : 314 000 alignements supervisés, 58 000 manuels
  • 9. HeTOP generic model • Compatible avec les recommandations de Tao et al. (2013)
  • 10. Validation Ontology tools Méthodologie d’intégration Raw data DB Parsers Model OWL instance Format
  • 14. Vers une pratique en web de données… http://www.hetop.fr/hetop/?la=es&r r=CGP_QC_QD33
  • 16. Semantic Web platform Clinical Data Warehouse N = 109 medical concepts WEB Bibliographic metadata providers Terminology providers Etc. Clinical data Omic data French-speaking article citations N = 880,000 Freely available French-speaking resources N = 117,000 Health terminologies N = 75 2.3 millions concepts Mappings & translations ECMT MT@HeTOP InfoRoute indexation 2007 1995 2012 2010
  • 17. Master M2IBM – Lina Soualmia & Catherine Duclos – LIM&Bio, UFR SMBH, Paris XIII
  • 18. • Hétérogénéité : • Formelle • En qualité • En couverture • Versionnage et historisation • Les licences ? • Pérennité et validité des URIs ? • Comment uniformiser ? Limites