2. Plan
• Notions de catalogue de données
• Les métadonnées : un support au catalogage
– Notion de métadonnées
– La standardisation
• Enjeux du catalogage : partage et diffusion
• Vers la constitution de géo-catalogues
– Les outils de catalogage actuels
– Les problèmes posés par le catalogage
• Initiatives de catalogage nationales, transnationales
– Les directives européennes INSPIRE
– INSPIRE et le catalogage en France
3. Notions de catalogue de données
• Cataloguer : « indexer et décrire des ressources
(données, documents) pour pouvoir les retrouver et les
consulter»
• A l’origine
– Catalogues « papier »
• Bibliothèques
• Services documentaires ..
• Evolution
– Catalogues informatisés
• Ils contiennent un outil de recherche
• Parfois ils permettent de visualiser les données
• Parfois ils permettent d’accéder aux données
4. Notions de catalogue de données
• Exemple de catalogue informatisé
– Google classique = un catalogue de documents web
• Catalogue alimenté par les informations récupérer par
les robots
• Documents indexés, entre autre, par une analyse « full
text » des pages web
• Moteur de recherche à base de mots clés
Catalogue
doc web
Moissonnage
automatisé
Indexation des document
Interrogation catalogue
5. Notions de catalogue de données
• Catalogue informatisé de données géoréférencées
Objectifs :
Trouver une carte, une image (fonction de localisation)
Mais aussi
• Donner des informations pour juger de la qualité et de
l’adéquation avec son besoin (fonction de description)
• Visualiser et découvrir le jeu de données (fonction de
représentation)
• Le télécharger (fonction d’accès)
6. Notions de catalogue de données
• Catalogue informatisé de données géoréférencées
Le Contenu des catalogues doivent permettre de répondre aux
questions :
• Quels sont les données disponibles sur un territoire x ?
• Comment puis-je les obtenir ?
• Combien coûtent-ils ?
• Que contiennent-ils ?
• Sous quels formats sont-ils disponibles ?
• Quelle en est la fréquence de mise à jour ?
Nécessité de structurer le contenu des catalogues : les
métadonnées
7. Les métadonnées : un support au catalogage
Définition :
Une métadonnée est une donnée qui renseigne sur la nature de certaines
autres données et qui permet ainsi leur utilisation pertinente.
Spécificité de l’information géoréférencée
En plus des descripteurs classiques (identification, qualité, contenu,
format)
• Informations sur la dimension spatiale :
– emprise du jeu de données (toponymie, rectangle
englobant)
– système de référence
– mode de représentation
8. Les métadonnées : un support au catalogage
Intérêt des métadonnées
• Rôle du producteur
– Gérer, faire connaître et valoriser en interne et en externe
le patrimoine d’information (et l’expertise associée)
– … tout en maîtrisant l’accès à ces informations
• Rôle de l’utilisateur
– Connaître l’existence de données, évaluer leur qualité (/ à
un usage donné)
9. DCMI
Dublin Core Metadata Initiative 1995
2003
ISO TC211
International Standard Organisation
CEN/TC 287
Comité Européen de Normalisation
FGDC
Federal Geographic Data Committee
1990
OGC
Open Geospatial Consortium 1994
ANZLIC
Australia- New Zealand Land
Information Council
1986
MARC
Machine-Readable Cataloging 1980
Métadonnées : standards
Pour l’information
géographique :
EN/ISO 19115
Les métadonnées : un support au catalogage
10. Les métadonnées : un support au catalogage
Le standard pour l’information géographique : ISO 19115
1. Identification,
2. Qualité,
3. Contraintes
d’accès,
4. Système de
référence,
5. Distribution,
6. Portrayal
catalogue,
7. Représentation
spatiale,
8. Content
Information,
9. Schéma
conceptuel,
10. Extension,
11. Maintenance,
11. Les métadonnées : notion de profil de métadonnées
« vue » ou « gabarit » du standard : extraction des éléments de la norme (et de son extension, si
nécessaire) selon les besoins d’une communauté, d’un projet, d’une application
Metadata
Content
Distribution
Reference System
Spatial Representation
DataQuality
Metadata Extension
Constraints
Identification
Maintenance
ApplicationSchemaPortrayal Catalogue Reference
0..1
*
*
0..1
*
*
1..*
*
* *
*
*
*
Metadata
Content
Reference System
Spatial Representation Metadata Extension
Constraints
Maintenance
ApplicationSchemaPortrayal Catalogue Reference
0..1
*
*
0..1
*
*
1..*
*
* *
*
*
*
12. Enjeux du catalogage : partage et diffusion
• Partager et diffuser des données et des
connaissances
Moteur de
recherche
SI SI
SI
Catalogue
X
Source : J.C. Desconnets / 2007
13. Enjeux du catalogage : partage et diffusion
• Contexte politique
– Décentralisation, l’information est au niveau local
– Gestion basée sur la concertation et le partenariat
• Contexte réglementaire
– Directives européenne INSPIRE sur la diffusion et l’accès à
l’information environnementale dans les pays de l’Union
– Accès de l’information vers le citoyen (convention Aarhus)
• Contexte technique
– Technologie, spécifications et standardisation qui permettent la
création d’architectures ouvertes et distribuées de SIE (global au
local)
14. ArcCatalog
9.x
M3Cat 1.5
Geonetwork
2.0
Reports V2
Nokis
MDweb 1.5
Meta
-Manager 4
Red
Spider 3.3
Licence GPL
Licence GPL
libre
Libre
/ versions
Licence
CeCILL
Propriétaire
Propriétaire
Propriétaire
Non
Non
SoftMap
InterMap
MapServer
MapServer
Ouvert
Ouvert
Non
non
Service
Z39.50
Service
CSW-2 OGC
Service Z39.50
Service Z39.50
Composant
supplémentaire
Service
CWS-2
FGDC, ISO
FGDC, ISO
ISO
ENV 12657
ISO
Multi-normes
FGDC, ISO
ISO
ESRI
Intelec
Géomatique
FAO
CERTU
BMBF
IRD, LIRMM,
Cemagref
Compusult
IONIC
Nom Licence
Interface
carto
Inter-
opérabilité
Normes Distributeur
Référentiels
associés
GEMET
AGROVOC,
GEMET,
BD Géo propre
Non
Non
Non
Non
Non
Non
Vers la constitution de géo-catalogues : les outils
Source : J.C. Desconnets et al. 2007
Vers la constitution de géo-catalogues
19. Vers la constitution de géo-catalogues
• Les problèmes posés par le catalogage
Les outils, oui mais :
– Place de la démarche de l’institution
– Méthodologie de mise en place (choix des descripteurs,
des référentiels (thesaurus et BD géographique)
– Alimentation des catalogues et leur mise à jour
– Communication entre les différents catalogues
• Les pistes actuelles
– Automatisation des métadonnées (moissonneur et
assistance à la saisie)
– Respect des standards pour rendre les outils
communicants (interopérables)
20. Initiatives de catalogage nationales,
transnationales
la directive INSPIRE (en vigueur le 15/5/2007)
• Elle crée plusieurs obligations pour les états membres :
• la fourniture des données selon des règles de mise en oeuvre
communes,
• la constitution de catalogues de données (métadonnées),
• l'application de règles d'interopérabilité,
• l'accès gratuit aux métadonnées,
• l'accès aux données pour les acteurs réalisant une mission rentrant
dans le cadre d'INSPIRE,
• les services pour permettre ces accès
21. Initiatives de catalogage nationales,
transnationales
INSPIRE : pour quoi faire ? :
fixer les règles pour « établir l’infrastructure d’information géographique
dans la Communauté européenne, aux fins des politiques
environnementales »
Qui doit se conformer à INSPIRE ? :
• tout gouvernement ou toute autre administration publique au niveau
national, régional ou local;
• toute personne physique ou morale exerçant des fonctions
d’administration publique en rapport avec l'environnement ; et
• toute personne physique ou morale ayant des responsabilités ou des
fonctions publiques, ou fournissant des services publics en rapport avec
l'environnement
22. Quelles données sont couvertes par la directive ?
• Données spatiales "sous forme électronique
« . Les actions concernant la création de métadonnées et la publication
élargie par des moyens électroniques s'applique à tous les ensembles
de données existants qui sont considérés comme géographiques »
Initiatives de catalogage nationales,
transnationales
23. Les métadonnées dans INSPIRE
Des règles de mise en œuvre pour les métadonnées : Adoptées le 14
mai 2008
• INSPIRE va requérir des États membres qu’ils créent des
métadonnées compréhensibles et d’une qualité spécifiée, et qu’ils
les maintiennent à jour.
• deux types :
– des métadonnées de données
– et des métadonnées de services
• Création dans un délai de 2 ans après la date d’adoption des
règles de mise en œuvre pour les données des annexes I et II
(avant 2010),
• un délai de 5 ans pour les données de l’annexe III (avant 2013).
25. INSPIRE et catalogage en France
Le GéoCatalogue est le moteur de recherche du GéoPortail de
l’information géographique publique.
cet outil combine des informations géographiques et thématiques
afin de faciliter l’accès de données produites :
- les administrations,
- les établissements publics,
- les collectivités territoriales.
28. Profil de métadonnées français
• Profil français de la norme ISO 19115 : Spécification de la
norme aux conditions d’application en France
• Extension de classes :
– Identification du jeu de données
– Contraintes sur les données
– Référentiel spatial
– Qualité de la donnée
• Liste de valeurs prédéfinies :
– sur les syst. de projection
– Toponymie
Notas del editor
What means cataloguing : it’ s means
De nombreuses propositions de standardisation relatives à ces métadonnées ont vu le jour ces dernières années (Dublin Core [DCMI 05], FGDC [FGDC 98], et ISO [ISO 03]) dans des domaines variés. En ce qui concerne l’information géographique, suite aux premières propositions élaborées par le FGDC fin des années 90, c’est le standard ISO 19115 – Information géographique – métadonnées [ISO 03] (ISO TC/211 group) qui a été retenu par la communauté internationale.
Les réflexions européennes montrent aussi l’importance des métadonnées et elles s’orientent vers une intégration des normes ISO dans les normes européennes. Le CEN/TC 287 a été réactivé pour transformer les normes issues des travaux de l'ISO/TC 211 en normes européennes et pour mise au point de profils européens. Début 2005, la norme ISO 19115 de 2003 a été adoptée comme norme européenne sous l’appellation EN ISO 19115.
Commentaire panorama des outils existants
Licence :
a- La plupart des solutions actuelles sont propriétaires et payantes et sont dans la majorité des cas incluses dans des offres plus larges conçues pour l’élaboration de Systèmes d’Information Géographiques dans leur ensemble (ArcCatalogue d’ESRI).
b- Les solutions diffusées sous licences libres (GPL, CeCILL) proposent des outils basés sur des technologies libres (langage, SGBD, serveur cartographique) et se focalisent essentiellement sur les fonctionnalités de catalogage et de localisation tout en privilégiant les interactions avec d’autres composants par l’implémentation des standards OGC, notamment.
Interface géographique :
En terme d’interactivité avec l’utilisateur, la majorité des outils proposent aujourd’hui des modules cartographiques qui donnent un appui à la construction des interrogations à base géographique mais aussi pour certains permettent la visualisation des données géoréférencées.
Interopérabilité :
L'élaboration de standards communs (services ISO, OGC) à tous les éditeurs de systèmes, logiciels, données et sur la conception d'outils de conversion pour le passage d'un système à l'autre est une solution pour les communications entre outils.
Normes:
La majorité des solutions actuelles implémentent les standards internationaux (ISO, OGC) qui sous-tendent la structuration des catalogues et assurent une partie de leur interopérabilité.
Référentiels :
Peu d’outils (NOKIS, MDweb) proposent l’exploitation de référentiels thématiques et spatiaux pour aider le producteur lors de l’indexation de ses jeux de données :
enrichissement des moteurs (affiner ou étendre les recherches)