1. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Genèse, application et futur
de BIOMIST: un système de
gestion du « cycle de vie »
de la donnée bio-médicale.
Marc Joliot, Ph.d., HdR, CEA
2. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Groupe d’Imagerie Neurofonctionnelle
Ø Depuis 1989, date de la création, le GIN a toujours été impliqué dans
l’acquisition et le traitement des bases de données d’imagerie.
1990
EVA IRM-3-Cité BIL&GIN I-Share
2011
Ø Participation à des consortium internationaux :
• CHARGE
• ENIGMA
Ø Analyse des bases existantes :
• UK-BIOBANK
• LIFE
• BIG
3. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
N Age IRM Tests Ψ ADN
EVA 845 [63, 75]
3D-T1 (0.9 mm)
T2/PD (5 mm)
MMSE, TMTA/B,
Rey15, Benton FRT,
etc…
(T0,T+2,T4,T+6,T+7,T+
9)
OUI
Coll. C Tzourio
Inserm U708
Approche épidémiologique pour l’étude du polymorphisme sur des
populations âgées
Base Neuroanatomiques du vieillissement
Ø Avant 2005 : Arborescence de répertoires
4. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Base Neuroanatomique du veillissement (EVA)
Les sujets homozygotes pour
l’allèle e4 présentaient une atrophie
de l’hippocampe précoce, prédictive
d’un déclin cognitif sévère, mesuré
7 ans plus tard.
Graphe de Manhattan illustrant l’association
pangénomique du volume de l’hippocampe
réalisée au sein du consortium CHARGE
incluant 9,234 participants âgés.
5. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
“Brain Imaging Laterality database” : BIL&GIN
Chaque individu a été vu 3 ou 4 fois :
• Anatomie & repos
• 20 tâches cognitives pour 300 sujets (9 sessions)
• 2 sessions de tests cognitifs
• Génétique
450 volontaires âgés de 18 à 58 ans :
• Base équilibrée pour la latéralité manuelle
• Base équilibrée pour le genre
Structure
Anatomie 3D
Fonction
Diffusion BOLD EPI :
Debriefing
BOLD EPI : 8mn
Quest. RESQ
9 sessions cognitivesResting state
Mazoyer 2015
6. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Analyse des besoins
Ø Accroissement du nombres d’individus : Avènement de l’aire des cohortes
Ø Accroissement de l’hétérogénéité des données :
• Acquisitions « multimodales » : Anatomiques / fonctionnelles / Diffusion
• Données non-imageries structurées (exp : Test)
• Données non-imageries non-structurées (exp : Débriefing / rapport
médicale)
Ø Généralisation de l’emploi de méta-analyses :
• L’état de repos a en partie été découvert grâce à des méta-analyses, soit
une utilisation non-programmée des données.
L
Cognitive tasks
rCBFvariation (%)
MT working memory
GV verb generation
CM mental calculus
LP phrase listening
LT story listening
LM word listening
IM mental imagery
LO logic
MV movement
Restversus
Mazoyer 2001
7. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Joliot 2010, HBM
Structure de BIL&GIN
8. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
34 Resting-state Networks : coverage of 98% of the brain gray matter
281 fMRI resting-state acquisitions
Pre-processing
Clustering
Individual ICA
281 sets of 25 Individual components
Atlas des réseaux du repos : MICCA (BIL&GIN)
Naveau 2012
R = 20
281 x 25 x 20 =
140500
composantes
9. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Retour d’expérience
• Interrogations majoritairement effectuées par les ingénieurs
• Pas de gestion fine des protections
• Corrections sans historique
• Paramètres d’analyses sauvegardés mais sans les pipelines
• Pas d’utilisation en test d’hypothèses et ou analyse de groupe
11. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Cahier des charges
Ø Gestion de la provenance : Traçabilité de l’évolution des données et des
traitements
Ø Adapté à la gestion de plusieurs protocoles
Ø Confidentialité
Ø Gestion de l’hétérogénéité des formats
Ø Adapté à la volumétrie de l’imagerie
Ø Gestion de l’hétérogénéité des sources : Flexibilité du modèle de données
Ø Gestion de la complexité des traitements : Accès aux grilles et contrôle de qualité
Ø Capacité à implémenter des analyses inter-sujets voir inter-protocoles
Ø Intégration des outils du chercheur : visualisation, chaines de traitements, outils
d’analyse…
12. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Ecosystème de données
Modalités d’imagerie
Données dérivées
Analyse et Interprétation
PACS local
ressources
web Grilles de calcul
Recueil de données
• Case Report Forms
• Psychologie
• Génétique
• Physiologie
• ...
DICOM
Données brutes
13. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
2 clients
Client riche Client léger
14. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Intégration DICOM
Health &
Care
improveme
nts
Public
Health
Research
Ø Reçoit et sert les données d’imagerie via le protocole DICOM
PACS
STORE
FIND/GET
STORE
DICOM workstation
ProxyClient
Teamcenter query
Rich client: open in
visualizer
Client WEB: papaya
browser
15. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
PLM workfows: Contrôle qualité automatisé et manuel
1. Assignation automatique à:
• projet de recherche
• définition de protocole
2. Vérification de la conformité
• Paramètres d’acquisition
• Quantité d’acquisitions
• Nombre d’instances DICOM
3. Notification par e-mail
• Data manager
• Investigateur Principal
16. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Traitement des données
Ø Intégration d’un système de gestion de flux de traitements (nipype)
• Peut couvrir n’importe quelle ligne de commande
• Compatible avec la plupart des ordonnanceurs de grilles de calcul
Ø Conservation/édition des paramètres de chaque étape du traitement
Ø Les données dérivées peuvent entrer dans de nouveaux flux de traitement
17. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Traçabilité des traitements de données
Ø Chaque étape du traitement:
• Stocke les résultats du traitement
• Stocke un rapport d’exécution
• Référence les items d’entrées
• Référence un jeu de paramètres
18. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Intégration des outils du chercheur
PLM
ODBC
JMP / SAS / Excel : analyse
statistique
Cube OLAP
Données
dérivées
Données
d’examens
19. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
I-SHARE / MRI-SHARE
Ø i-Share est la plus grande étude scientifique jamais réalisée sur la
santé des jeunes : 30000 prévus (PI . C. Tzourio, Investissement
d’Avenir) :
Ø Mri-Share + Bio-Share : Sous ensemble de 2000 individus
- Données démographiques
- Tests cognitifs
- Historique médicale
- Historique comportementale
Mazoyer 2017
+ Génétique
20. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Qualification en volumétrie et hétérogénéité : MRI-share
Ø Nombre de sujets : 1859
Ø Nombre d’instances DICOM : 6 064 451
Ø Démographie : Age / sexe / latéralité
Ø Test : Questionnaire de repos
21. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Qualification en complexité : Archeoneuro
Node
002
Scanner
Ψ experimental
control
PACS
ftp
DICOM
Data import services
• Data recognition and
mapping
• Matching of imaging
and behavioral data Scientific workflows
1. fMRI data preprocessing
2. Behavioral data parsing
and statistical modelling
3. Outputs sorting
Quality control
workflows
• Automated validation
• Visual QC
• Notification
scp/ssh
High Performance
Computing cluster frontend
Nipype workflows
Node
001
scp
………………………
………………
Node
N
………………………
………………
22. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Rendu du projet
Ø Publications : 2 revues, 10 conférences, 2 ouvrages
Ø Thèses : M. Allanic (2015) et C.C. Phan (2016)
Ø Projets collaboratifs :
Ø Drive SPC (B. Tavitian)
Ø Ginesis-lab
Ø Création d’une unité de buisness médical au sein de Cadesis/Fealinx
avec embauche de 4 personnes : Création de la solution SwoMed version
industriel de BIOMIST
23. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
LABCOM Ginesis-lab
Ø Objectifs
• Gestion intégrée des chaînes de traitement de l’imagerie dans l’optique
de la création de bio-marqueurs
• Développer des méthodes de classification et d’analyse prédictive sur
les données d’imagerie
• Amélioration des interfaces chercheurs / médecins
Ø Projet ANR LabCom : édition 2016, ANR-LCV2-0006-01
Ø Direction
• Marc Joliot, DR, CEA
• P. Boutinaud, DR recherche et innovation, Fealinx
Ø Localisation
• Bâtiment Paul Broca Nouvelle Aquitaine, Neurocampus
24. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
De Biomist à Ginesis-lab
Cohortes
Cohorts
(Data Management)
Personnalized medicine
(SaaS)
Hospital, CRO
(Clinical studies)
Structured
reports
Images
processing
Learning
Biomarkers
Innovations
LaBIMA
Prediction
LABCOM : ANR 16-LCV2-006-01 : Starting 03/04/2017
25. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Les équipes
GIN / IMN
Dir : N. Tzourio / E. Bezard
Fealinx / Cadesis
DG : X. Ruffenach
• Benoit Eynard
• Alexandre Durupt
• Nada Matta
27. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Méthodologie de développement : AGILE
Ø Project owner & Scrum
master : Cadesis
Ø Research Unit :
Cadesis / GIN / UTC / UTT
WP1 : Project Management
WP2 : PLM for BioMedical Imaging
WP3 : Graph similarity & visualization
WP4 : Semantic enhancement
WP5 : Integration & Quality
WP6 : Exploitation & Dissemination
28. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Cahier des charges
Ø Gestion de la provenance : Traçabilité de l’évolution des données et des
traitements
Ø Adapté à la gestion de plusieurs protocoles
Ø Confidentialité
Ø Gestion de l’hétérogénéité des formats
Ø Adapté à la volumétrie de l’imagerie
Ø Gestion de l’hétérogénéité des sources : Flexibilité du modèle de données
Ø Gestion de la complexité des traitements : Accès aux grilles et contrôle de qualité
Ø Capacité à implémenter des analyses inter-sujets voir inter-protocoles
Ø Intégration des outils du chercheur : visualisation, chaines de traitements, outils
d’analyse…
29. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Gestion sémantique des données d’imagerie
bio-médicale pour la recherche
Utiliser les outils du « Product
Lifecycle Management » pour
gérer les données, documents
et informations bio-médicales.
Définir et implémenter des
outils permettant de visualiser
et manipuler les graphes
représentant les relations entre
objets d’intêrets.
Ø
Ø
30. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Architecture du PLM
Ø Cycle de vie du produit industriel
• Conception (données CAO)
• Production
• Maintenance
• Retrait
Ø Gestion du Cycle de vie du Produit
• 20 ans de développement
• SIEMENS Teamcenter :
16 million de licences
Ø Architecture 4 « tier »
• Stockage unique
• Réplication de données
• Extensible
31. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Trois catégories d’objets
Allanic 2017
32. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Modèle de données BMI-LM
Graphe de données
Modèle
33. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Gestion de la provenance
PROV-DM standard (http://www.w3.org/TR/2013/REC-prov-dm-20130430/).
Ø Parallèle entre le standard PROV et le BMI-LM data model.
Allanic 2017
34. GIN-IMN, UMR5293 CNRS – CEA – UBx M. Joliot for GIN 06/12/2017
Classification hiérarchique
• Chaque item est classifié dans une
ou plusieurs classes
• Une classe peut porter des attributs
• La classification est facilement
extensible
• Les catégories peuvent provenir
d’ontologies spécifiques d’un
domaine