Comment intégrer les termino-ontologies de santé dans le web des données / Julien Grosjean
1. Comment intégrer les termino-ontologies de
santé dans le web de données
Julien Grosjean, PhD
TIBS, LITIS Lab
Rouen University Hospital & Rouen Medical School, Normandy University, France
LIMICS, INSERM U1142
julien.grosjean@chu-rouen.fr
2. Les SOC
• Les classifications vocabulaires
contrôlés (ou lexiques) structurés
• Depuis l’antiquité, évolution des
classifications en même temps que
la connaissance
• Fort intérêt depuis la fin du
XVIIIème siècle avec la classification
scientifique des espèces puis grand
développement jusqu’à nos jours
Ontologie
Terminologie
Thesaurus
Nomenclature
Taxinomie
Dictionnaire
Lexique
Liste
complexité
Les principaux Systèmes
d’Organisation des Connaissances
(SOCs)
4. Les Systèmes Multi-SOC
(académiques)
• UMLS (USA)
• BioPortal (USA) -> instance
francophone LIRMM
• Ontology Lookup Service (UK)
• LexGrid / NCI Term browser (USA)
• HeTOP (France)
5. Standards?
• Quel normes ? ISO 25964, …
• Quels formats ? SKOS, OWL, RDF, … ?
• Quels modèles ?
• Quel formalisme ?
• Quels outils de gestion ? CTS2, … ?
• …
6. BioPortal
• Standford (M. Musen)
• https://bioportal.bioontology.org/
• 560 SOCs en anglais
• Entrepôt RDF
• Politique de téléversements (« one-stop shop »)
• LE serveur « open-data »
• Version francophone au LIRMM (C. Jonquet) :
http://bioportal.lirmm.fr/
• Attention : ontology vs ontology…
« The world’s most comprehensive repository of biomedical ontologies »
7. HeTOP
• CHU de Rouen – CISMeF / LIMICS (S. J. Darmoni)
• www.hetop.eu
• 75 SOC, plusieurs langues, orienté français/anglais
• Non ouvert
• Politique d’intégration et d’édition
• Méta-modèle et graphe de données
• Travail sur le fond et la forme
16. Semantic Web platform
Clinical Data
Warehouse
N = 109 medical
concepts
WEB
Bibliographic
metadata providers
Terminology
providers
Etc.
Clinical
data
Omic
data
French-speaking
article citations
N = 880,000
Freely available
French-speaking
resources
N = 117,000
Health terminologies
N = 75
2.3 millions concepts
Mappings &
translations
ECMT
MT@HeTOP
InfoRoute
indexation
2007
1995
2012
2010
17. Master M2IBM – Lina Soualmia & Catherine Duclos – LIM&Bio, UFR SMBH, Paris XIII
18. • Hétérogénéité :
• Formelle
• En qualité
• En couverture
• Versionnage et historisation
• Les licences ?
• Pérennité et validité des URIs ?
• Comment uniformiser ?
Limites