1. 12/8/2013
Introduction à l’Open Data en PACA
- 5@7 AtoS Aix-en-Provence -
Largement inspiré d'extraits de @schignard, @straumat
@valeriepeugeot, @ChristianFaure, @LiberTIC, et bien d'autres... Merci.
Le contenu de ce document est mis à disposition selon les termes de la
Licence Creative Commons Attribution - Partage dans les Mêmes Conditions 3.0 France.
2. 2
5@7 AtoS Aix
Open Data
▶ Une donnée est un fait «brut» qui n’est pas interprété
(ce n’est pas une information déduite)
▶ Une donnée publique est une donnée gérée dans le cadre
d’une mission de service public - à laquelle est associée des
droits d’accès et, parfois, de réutilisation
▶ Cadre juridique : lois FOI (Freedom of Information)
– USA : 1996
– UK : 2000
– France : 1978 (loi CADA)
Définition d'une donnée publique
3. 3
5@7 AtoS Aix
Open DataDéfinition d'une donnée ouverte
ou Open Data
▶ Une donnée ouverte est une information brute, publique, librement accessible.
▶ Ouverture technique,
▶ Ouverture économique,
▶ Ouverture juridique
▶ Mais aussi complète, sans erreurs, accessibles de façon pérenne par une machine
▶ Et sans risque de sécurité ou d’atteinte à la vie privé ou aux droits d’auteur
donnée brute, exploitable de manière automatique,
dans un format le plus ouvert possible (non propriétaire),
licence clarifiant les droits et les obligations,
les plus ouvertes possibles (obligation d’attribution)
peu ou pas de redevances limitant l’utilisation,
tarification maximale au coût marginal
5. 5
5@7 AtoS Aix
Open Data
Utilité de l’open d’ata
Applications, services
▶ Affichage publics dans des
lieux de vie
– Lieux publics
– Centres commerciaux, commerces
– Institutions
– Pôles d’échange
▶ Site Internet
– Reprise de contenu
– Mashup cartographique
▶ Applications mobiles
– Information géolocalisée
– Réalité augmentée
– Personnes à mobilité réduite
Consultation
▶ Recherche d’information
▶ Transparence
6. 6
5@7 AtoS Aix
Open DataL’Open Data au niveau national
en septembre 2012
▶ Plus de 350 000 jeux de données
▶ Sources
– INSEE : 6 fichiers divisés en 280 000 zones géographiques
– Développement durable : plus de 35 000 fichiers
– data.gouv.fr : environ 2000 fichiers
– Autres services publics : environs 600 fichiers
7. 7
5@7 AtoS Aix
Open DataMacro-évaluation de l'OpenData
national en septembre 2012
▶ Formats de données cohérents
▶ Protocoles de communication cohérents
▶ 50 000 fichiers en doublon
▶ Beaucoup de données rafraichies à l’année
▶ Pas de modèle de données commun
▶ Beaucoup de petits fichiers
▶ Peu d’API
8. 8
5@7 AtoS Aix
Open DataUtilisation de l’OpenData à Rennes
en septembre 2012
Fonctions Nombre
Informations sur le transport 12
Géolocalisation 12
Cartographie 6
Réalité augmentée 3
Information sur les événements 2
Réseau social 1
▶ 13 applications pour téléphones mobiles
▶ 7 sites web
▶ Source quasi unique : API Data Keolis-Rennes
9. 9
5@7 AtoS Aix
Open DataDonnées ouvertes en PACA
en septembre 2012
▶ 236 jeux de données
– 1 fichier en mise à jour quotidienne
(programme de Marseille Provence 2013)
– 15 fichiers en mise à jour mensuelle
(tourisme, culture, agriculture)
– 98 fichiers issus de l’état
– Beaucoup de petits fichiers
▶ Aucune API
▶ Lepilote.com ne partage pas ses données
▶ Le CG13 ne partage pas ses données
Marseille 09-2012
Toulon 04-2013
Nice 09-2013
10. 10
5@7 AtoS Aix
Open Data
▶ RTM
▶ Cartreize
▶ Aix en bus
▶ TER
▶ Bus de l'Agglo d’Aubagne
▶ Bus de l'Etang
▶ Libébus (Salon)
▶ Réseaux Envia et ACCM (Arles)
▶ Ouest Provence Le Bus (Istres)
…
Lepilote.com
12. 12
5@7 AtoS Aix
Open DataDébats autour de l’OpenData
▶ des réticences dans les administrations
▶ un nuage de transparence dans un
grand bol d’opacité
▶ des données de mauvaise qualité
▶ des applications qui améliorent la vie
quotidienne, pas la démocratie
▶ des citoyens mal informés, non formés
▶ des données non mobilisables pour le
commun de mortels
▶ des contributeurs trop peu nombreux…
▶ des contributeurs exploités
▶ des craintes du Big Brother
▶ API vs Données
13. 13
5@7 AtoS Aix
Open Data
▶ Open Street Map est un service de cartographie en ligne comme GoogleMaps
▶ OSM est alimenté par des
contributeur volontaires
« Wikipedia des cartes »
▶ les données brutes sont
disponibles en téléchargement
– Planète, zone ou pays
– Mise à jour hebdomadaire,
quotidienne ou horaire
– 30 Gb de XML compressé
pour la planète entière
Crowdsourcing
14. 14
5@7 AtoS Aix
Open DataExemple de journalisme de base
de données ou Data Journalism
▶ John Snow crée une carte de
l’épidémie de choléra à Londres
et trouve le vecteur de la maladie
▶ analyse des données pour informer
le grand public
▶ utilisation de la data visualization
16. 16
5@7 AtoS Aix
Open DataLes mentions au bac en fonction du
prénom (Baptiste Coulmont)
17. 17
5@7 AtoS Aix
Open Data
▶ permet de relier de façon structurée
des données sur internet et de les
interroger, normalisées par le W3C
▶ Triplet RDF : sujet, prédicat, objet
▶ Exemple : « Marcel aime Haricot »
▶ Quelques initiatives de normalisation
des structures de données (ontologies)
de l'Open Data vers
le Web sémantique
Les 5 niveaux d’ouverture
des données http://5stardata.info/
Web Sémantique
18. 18
5@7 AtoS Aix
Open Data
▶ Passer d'un monde où nous publions des données pour
les humains à un monde où nous publions aussi des
données lisibles et compréhensibles par les machines.
▶ L'objectif étant de permettre aux machines de faire un
peu plus de travail à notre place :
– Recherche plus intelligentes avec SPARQL :
nom, date de naissance des personnes
(présente sur le web) née à Marseille depuis 1900
– Inférences :
1. Imaginons une base sur les gouts des gens
« Marcel aime Haricot »
2. Imaginons une autre base sur les aliments
« Haricot est un légume »
3. Une machine peut en déduire :
« Marcel aime certains légume »
– Mashup de données. Exemple sur BBC Music
Pourquoi le web sémantique
19. 19
5@7 AtoS Aix
Open DataLe monde des données reliées
en 2010 (web of linked data)
20. 20
5@7 AtoS Aix
Open DataContribuez à l’OpenData !
▶ OpenStreetMap Marseille chaque 1er lundi de mois
▶ Portail Open Data de la région PACA
▶ data.gouv.fr
▶ data-publica.com
▶ data.okfn.org
▶ AtoS - Datalift
21. 21
5@7 AtoS Aix
Open Data
Agenda
DATALIFT – De la donnée brute à la
donnée sémantique interconnectée
Labo. « Nouvelles Architectures de Traitement de Données »
dont la vocation est le « Big and Linked Data »
ATOS – SI Markets - gabriel.kepeklian@atos.net – Resp. R&D
Datalift est un Socle
open source d’élévation
et d’interconnexion de
données. Ce projet
rassemble plusieurs
partenaires entreprises
et académiques.
Traiter et interopérer des données
hétérogènes, non normalisées, provenant
d’autres entreprises, d’autres administrations
Import de données brutes (datasets) hétérogènes.
Sélection des ontologies adaptées
Conversion en triplets RDF (sujet, prédicat, objet)
Publication dans le web des donnée
Interconnexion avec d’autres données sur le web.
Services web d’exploitation par SPARQL.
Enjeux
Solution
Contacts
Exploitation
Interconnection
Publication
Conversion
Selection
Raw data
Exploited data
Data
Set
Data
Set
Data
Set
Data
Set
Data
Set
Data
Set
Dat
aSe
t
External Internal
DataSet
DataSet
DataSet
DataSet
DataSet
22. 22
5@7 AtoS Aix
Open Data
▶Questions ?
▶Remarques ?
▶Quelques sources d'informations que j'apprécie :
Et vous ?