SlideShare una empresa de Scribd logo
1 de 19
Publication de données d’observation dans le Web
de données
Esther Dzalé Yeumo Kaboré 30/ 05/ 2013
.02
Le projet scientifique – ALTERPRO
INRA, Plante&Cité, ONEMA, Plan Ecophyto 2018
 Problématique
 Les chenilles sont responsables de la défoliation des pins (b) et des cèdres
 Les poils des chenilles (a) sont très allergènes (c, d)
 Les chenilles prolifèrent sur le territoire depuis des années, aidées par le réchauffement climatique
.03
Le projet scientifique – ALTERPRO
INRA, Plante&Cité, ONEMA, Plan Ecophyto 2018
 Objectifs
 Contrôler les populations de Processionnaire du Pin
 à un niveau tolérable permettant de protéger hommes, plantes et animaux
 avec des moyens écologiques : piéger les papillons mâles avec des pièges à phéromones
pour limiter la reproduction
 Comparer l’efficacité des pièges et des phéromones disponibles sur le marché
.04
Protocole de l’expérimentation
Pose des pièges à phéromones sur les sites test
Comptage des papillons piégés sur les sites test
Comptage des nids de chenilles sur les
sites test et témoin
Période de piégeage des papillons
Période de dénombrement des
nids de chenilles
.05
Les données de l’expérimentation
 Données descriptives des sites : géo-localisation, configuration paysagère, nombre
d’arbres, hauteur des arbres, superficie, historique des traitements (chimiques ou non)
contre la Processionnaire du Pin, etc.
 Données descriptives de l’expérimentation : types de piège et types de phéromone
utilisés, nombre de pièges, dates de pose et de démontage des pièges
 Résultats de l’expérimentation : nombre de papillons piégés, nombre d’arbres relevés sur
sites test et témoin, nombre de nids décomptés sur sites test et témoin
.06
Pourquoi une démarche LOD
 L’INRA s’est doté d’une Politique de partage des données
 Besoin interne en compétences sur les technologies du Web sémantique
 Les données de l’expérimentation présentent plusieurs intérêts
 Pour d’autres chercheurs
 Pour les gestionnaires d’espaces verts
 Pour le grand public
 En l’état, les données étaient difficiles à comprendre et à réutiliser sans aide humaine
 Sens des colonnes/lignes/cellules, cellules multi-valuées, unités de mesure
hétérogènes, ambiguïtés, etc.
.07
.08
.09
Les étapes de la publication
.010
Comprendre et qualifier les données
 Récupérer toute documentation utile sur les données
 Schéma (XML, base de données relationnelle), rapports, etc.
 Se procurer un échantillon des données
 Échanger avec les producteurs de données
 Désambiguïser, harmoniser, préciser
.011
Modéliser
 Lister les objets d’intérêt
 Objets matériels (piège, phéromone, chenille, etc.), ou immatériels/concepts (piégeage,
campagne d’observation, etc.)
 Décrire les objets : attributs, relations, classes
 L’utilisation de vocabulaires standards accroît le potentiel d’interopérabilité et de
réutilisation des données => LOV (Linked Open Vocabularies)
 Établir des liens vers des ressources externes
 Privilégier des sources de référence (Insee pour les communes) ou provenant de
partenaires => qualité, fiabilité, pérennité
.012
Créer la base de connaissances
 Identifier les données (URI: Uniform Resource Identifier)
 Disposer d’une politique d’URI garantissant unicité (sans ambiguïté), pérennité (nom de
domaine maîtrisé)
 Préférer le protocole HTTP
 Transformer les données au format RDF
 Par programme (XLWrap, XLST, etc.)
 Avec des outils (TopBraid, GoogleRefine, etc.)
 Mettre les données dans un entrepôt RDF (Sesame, Jena, etc.)
.013
Faire savoir
 Catalogue de Linked data
 http://datahub.io/, Lov : http://lov.okfn.org/dataset/lov/, etc.
 Moteur de recherche sémantique
 Sindice : http://sindice.com/, etc.
 Portail ad hoc
.014
Compétences mobilisées
IST (gestion des
connaissances)
Informatique
Métier/Scientifique
•Transformation
•Implémentation triple store
Production des
données
•Métadonnées
•Vocabulaires
•Modélisation (ontologie)
•Documentation des données
•Qualité des données
•Interfaces d’accès (API, Mashup)
.015
Résultats
 Une base de connaissances accessible par divers moyens : requêtes SPARQL, API,
appel d’URIs
 Des données enrichies et mises en contexte grâce à divers liens : geospecies, qudt,
Insee
 Des données faciles à comprendre, et à réutiliser : vocabulaires connus et/ou
documentés, formats et protocoles standards
 Un modèle de données et des vocabulaires réutilisables : pièges, phéromones ,
configurations paysagères
.016
.017
Les bénéfices internes
 Une manière efficace de répondre à un impératif : l’ouverture des données de la recherche
 Une occasion d’augmenter la qualité des données produites : clarification, harmonisation,
enrichissement, explicitation et documentation des données de manière standardisée
 Une voie de sortie de la logique des silos
 L’opportunité de s’insérer dans un écosystème
 Un moyen supplémentaire de valoriser son expertise
.018
Les bénéfices pour la communauté
 Un gain de temps grâce à l’expertise disponible réutilisable : modèle, données
 Une réutilisation des données facilitée : données structurées, documentées, accessibles par
programme
 Une possibilité d’enrichir ses propres données : liens
.019
Merci de votre attention!

Más contenido relacionado

Destacado

Mobile app auquiere
Mobile app auquiereMobile app auquiere
Mobile app auquiereCIRB_CIBG
 
Habilidades motrices basicas
Habilidades motrices basicasHabilidades motrices basicas
Habilidades motrices basicasvalendr2702
 
La tour infernale_de_las_vegas_j_l_j1
La tour infernale_de_las_vegas_j_l_j1La tour infernale_de_las_vegas_j_l_j1
La tour infernale_de_las_vegas_j_l_j1Dominique Pongi
 
C.rendu du ca du 25.04.013
C.rendu du ca du 25.04.013C.rendu du ca du 25.04.013
C.rendu du ca du 25.04.013jccalmes
 
Presentación1
Presentación1Presentación1
Presentación1Vegahyu
 
[Paroles de DSI] Présentation D.FI Services | Nantes 2012
[Paroles de DSI]  Présentation D.FI Services | Nantes 2012[Paroles de DSI]  Présentation D.FI Services | Nantes 2012
[Paroles de DSI] Présentation D.FI Services | Nantes 2012Groupe D.FI
 
Radicación Circular
Radicación Circular Radicación Circular
Radicación Circular Geral Melo
 
09 on-ne-voit-pas-ca-tous-les-jours
09 on-ne-voit-pas-ca-tous-les-jours09 on-ne-voit-pas-ca-tous-les-jours
09 on-ne-voit-pas-ca-tous-les-joursDominique Pongi
 
NWX2011 - Refonte de site e-commerce
NWX2011 - Refonte de site e-commerceNWX2011 - Refonte de site e-commerce
NWX2011 - Refonte de site e-commerceNormandie Web Xperts
 
Once10quince
Once10quinceOnce10quince
Once10quinceNoragoaz
 

Destacado (20)

Mobile app auquiere
Mobile app auquiereMobile app auquiere
Mobile app auquiere
 
ejercicio
ejercicioejercicio
ejercicio
 
Habilidades motrices basicas
Habilidades motrices basicasHabilidades motrices basicas
Habilidades motrices basicas
 
S arts éphémères
S arts éphémèresS arts éphémères
S arts éphémères
 
La tour infernale_de_las_vegas_j_l_j1
La tour infernale_de_las_vegas_j_l_j1La tour infernale_de_las_vegas_j_l_j1
La tour infernale_de_las_vegas_j_l_j1
 
C.rendu du ca du 25.04.013
C.rendu du ca du 25.04.013C.rendu du ca du 25.04.013
C.rendu du ca du 25.04.013
 
Presentación1
Presentación1Presentación1
Presentación1
 
[Paroles de DSI] Présentation D.FI Services | Nantes 2012
[Paroles de DSI]  Présentation D.FI Services | Nantes 2012[Paroles de DSI]  Présentation D.FI Services | Nantes 2012
[Paroles de DSI] Présentation D.FI Services | Nantes 2012
 
Radicación Circular
Radicación Circular Radicación Circular
Radicación Circular
 
Aspirine (serieux)
Aspirine (serieux)Aspirine (serieux)
Aspirine (serieux)
 
Sélection de Visuels
Sélection de VisuelsSélection de Visuels
Sélection de Visuels
 
Xerrada matematica2
Xerrada matematica2Xerrada matematica2
Xerrada matematica2
 
09 on-ne-voit-pas-ca-tous-les-jours
09 on-ne-voit-pas-ca-tous-les-jours09 on-ne-voit-pas-ca-tous-les-jours
09 on-ne-voit-pas-ca-tous-les-jours
 
NWX2011 - Refonte de site e-commerce
NWX2011 - Refonte de site e-commerceNWX2011 - Refonte de site e-commerce
NWX2011 - Refonte de site e-commerce
 
Presentación hcd
Presentación hcdPresentación hcd
Presentación hcd
 
Fete des-voisins
Fete des-voisinsFete des-voisins
Fete des-voisins
 
Día de los muertos
Día de los muertosDía de los muertos
Día de los muertos
 
Web2day 2013 - Nantes
Web2day 2013 - NantesWeb2day 2013 - Nantes
Web2day 2013 - Nantes
 
Once10quince
Once10quinceOnce10quince
Once10quince
 
Los virus
Los virusLos virus
Los virus
 

Similar a Publication de données d'observation dans le Web de données - Retour d'expérience

OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesopenminted_eu
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Le_GFII
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...ABES
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...infoclio.ch
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationAntidot
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...SemWebPro
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...AssociationAF
 
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...catherine roussey
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéAntidot
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 

Similar a Publication de données d'observation dans le Web de données - Retour d'expérience (20)

Presentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonusPresentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonus
 
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
 
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
Open Mining Infratsructure for TExt & Data : une infrastructure text-mining a...
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
 
Ns jo bim2011 fr
Ns jo bim2011 frNs jo bim2011 fr
Ns jo bim2011 fr
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
 
Presentation jeudistv2
Presentation jeudistv2Presentation jeudistv2
Presentation jeudistv2
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
 
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
Le cahier de laboratoire électronique à l’Inserm : changement de pratiques, c...
 
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...
Présentation du projet de l'irstea sur l'annotation des bulletins d'alerte ag...
 
Cemagref
CemagrefCemagref
Cemagref
 
Ontology Repository and Ontology-based Services
Ontology Repository and Ontology-based ServicesOntology Repository and Ontology-based Services
Ontology Repository and Ontology-based Services
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 
SIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophonesSIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophones
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 

Publication de données d'observation dans le Web de données - Retour d'expérience

  • 1. Publication de données d’observation dans le Web de données Esther Dzalé Yeumo Kaboré 30/ 05/ 2013
  • 2. .02 Le projet scientifique – ALTERPRO INRA, Plante&Cité, ONEMA, Plan Ecophyto 2018  Problématique  Les chenilles sont responsables de la défoliation des pins (b) et des cèdres  Les poils des chenilles (a) sont très allergènes (c, d)  Les chenilles prolifèrent sur le territoire depuis des années, aidées par le réchauffement climatique
  • 3. .03 Le projet scientifique – ALTERPRO INRA, Plante&Cité, ONEMA, Plan Ecophyto 2018  Objectifs  Contrôler les populations de Processionnaire du Pin  à un niveau tolérable permettant de protéger hommes, plantes et animaux  avec des moyens écologiques : piéger les papillons mâles avec des pièges à phéromones pour limiter la reproduction  Comparer l’efficacité des pièges et des phéromones disponibles sur le marché
  • 4. .04 Protocole de l’expérimentation Pose des pièges à phéromones sur les sites test Comptage des papillons piégés sur les sites test Comptage des nids de chenilles sur les sites test et témoin Période de piégeage des papillons Période de dénombrement des nids de chenilles
  • 5. .05 Les données de l’expérimentation  Données descriptives des sites : géo-localisation, configuration paysagère, nombre d’arbres, hauteur des arbres, superficie, historique des traitements (chimiques ou non) contre la Processionnaire du Pin, etc.  Données descriptives de l’expérimentation : types de piège et types de phéromone utilisés, nombre de pièges, dates de pose et de démontage des pièges  Résultats de l’expérimentation : nombre de papillons piégés, nombre d’arbres relevés sur sites test et témoin, nombre de nids décomptés sur sites test et témoin
  • 6. .06 Pourquoi une démarche LOD  L’INRA s’est doté d’une Politique de partage des données  Besoin interne en compétences sur les technologies du Web sémantique  Les données de l’expérimentation présentent plusieurs intérêts  Pour d’autres chercheurs  Pour les gestionnaires d’espaces verts  Pour le grand public  En l’état, les données étaient difficiles à comprendre et à réutiliser sans aide humaine  Sens des colonnes/lignes/cellules, cellules multi-valuées, unités de mesure hétérogènes, ambiguïtés, etc.
  • 7. .07
  • 8. .08
  • 9. .09 Les étapes de la publication
  • 10. .010 Comprendre et qualifier les données  Récupérer toute documentation utile sur les données  Schéma (XML, base de données relationnelle), rapports, etc.  Se procurer un échantillon des données  Échanger avec les producteurs de données  Désambiguïser, harmoniser, préciser
  • 11. .011 Modéliser  Lister les objets d’intérêt  Objets matériels (piège, phéromone, chenille, etc.), ou immatériels/concepts (piégeage, campagne d’observation, etc.)  Décrire les objets : attributs, relations, classes  L’utilisation de vocabulaires standards accroît le potentiel d’interopérabilité et de réutilisation des données => LOV (Linked Open Vocabularies)  Établir des liens vers des ressources externes  Privilégier des sources de référence (Insee pour les communes) ou provenant de partenaires => qualité, fiabilité, pérennité
  • 12. .012 Créer la base de connaissances  Identifier les données (URI: Uniform Resource Identifier)  Disposer d’une politique d’URI garantissant unicité (sans ambiguïté), pérennité (nom de domaine maîtrisé)  Préférer le protocole HTTP  Transformer les données au format RDF  Par programme (XLWrap, XLST, etc.)  Avec des outils (TopBraid, GoogleRefine, etc.)  Mettre les données dans un entrepôt RDF (Sesame, Jena, etc.)
  • 13. .013 Faire savoir  Catalogue de Linked data  http://datahub.io/, Lov : http://lov.okfn.org/dataset/lov/, etc.  Moteur de recherche sémantique  Sindice : http://sindice.com/, etc.  Portail ad hoc
  • 14. .014 Compétences mobilisées IST (gestion des connaissances) Informatique Métier/Scientifique •Transformation •Implémentation triple store Production des données •Métadonnées •Vocabulaires •Modélisation (ontologie) •Documentation des données •Qualité des données •Interfaces d’accès (API, Mashup)
  • 15. .015 Résultats  Une base de connaissances accessible par divers moyens : requêtes SPARQL, API, appel d’URIs  Des données enrichies et mises en contexte grâce à divers liens : geospecies, qudt, Insee  Des données faciles à comprendre, et à réutiliser : vocabulaires connus et/ou documentés, formats et protocoles standards  Un modèle de données et des vocabulaires réutilisables : pièges, phéromones , configurations paysagères
  • 16. .016
  • 17. .017 Les bénéfices internes  Une manière efficace de répondre à un impératif : l’ouverture des données de la recherche  Une occasion d’augmenter la qualité des données produites : clarification, harmonisation, enrichissement, explicitation et documentation des données de manière standardisée  Une voie de sortie de la logique des silos  L’opportunité de s’insérer dans un écosystème  Un moyen supplémentaire de valoriser son expertise
  • 18. .018 Les bénéfices pour la communauté  Un gain de temps grâce à l’expertise disponible réutilisable : modèle, données  Une réutilisation des données facilitée : données structurées, documentées, accessibles par programme  Une possibilité d’enrichir ses propres données : liens
  • 19. .019 Merci de votre attention!