Usages et mésusages des jeux et d’Internet chez les étudiants à La Réunion
Rapport données publiques 2011 - #Opendata
1. Les Données publiques
au service de l’Innovation
et de la Transparence
Pour une politique ambitieuse
de réutilisation des données publiques
Ecole des Ponts ParisTech
Rapport remis à la Délégation aux Usages de l’Internet
dans le cadre du portail Proxima Mobile
de services aux citoyens sur terminaux mobiles
Juillet 2011
2.
3.
4. A propos de ce rapport
La réutilisation des données publiques est modes de gouvernance, MM. Pierre-Jean
un enjeu majeur de l’action publique à l’ère Benghozi et Laurent Gille, ont accepté
numérique. A la croisée des nouveaux usages d’encadrer le travail de ce groupe.
d’Internet et des modes de gouvernance
M. Benghozi est Directeur de recherche
ouverte les plus récents, il ouvre le champ à de
CNRS, Directeur du Pôle de Recherche en
nouveaux domaines de l’action de l’État.
Économie et Gestion et professeur d’économie
Ce rapport présente les conclusions d’une à l’École Polytechnique (titulaire de la Chaire
étude sur la réutilisation des données Orange Innovation et Régulation des Services
publiques, menée pour la Délégation aux Numériques), et responsable du pôle
usages de l’Internet auprès du Ministère de Innovation du Master Innovation et Régulation
l’Industrie, de l’Energie et de l’Economie de l’Economie Numérique de Télécom
numérique et du Ministère de l’Enseignement ParisTech. M. Laurent Gille, enseignant-
supérieur et de la Recherche dans le cadre du chercheur au Département de Sciences
Master d’Action Publique de l’École des Ponts économiques et sociales de Télécom
ParisTech. ParisTech, est responsable du parcours
Industries de Réseaux du Master Innovation et
Elle met en perspective la problématique et
Régulation de l’Economie Numérique.
les enjeux de l’Open Data, propose un état des
lieux de la réutilisation des données publiques Les conclusions de l’étude ont été rédigées
en France, et dessine trois scénarios prospectifs de novembre à janvier 2011, et présentées au
pour l’évolution future de ce mouvement. Elle public le 20 janvier 2011 au Ministère de la
présente seize propositions pour une politique Recherche et de l’Enseignement supérieur.
nationale ambitieuse d’ouverture et de
Ce rapport a été finalisé par Romain
réutilisation des données publiques.
Lacombe entre mars et début juin 2011. Il ne
Quatre élèves de l’Ecole des Ponts fait qu’évoquer les développements les plus
ParisTech, Pierre-Henri Bertin, Romain récents, et présente une synthèse des
Lacombe, François Vauglin et Alice évolutions qui ont eu lieu au printemps 2011
Vieillefosse ont mené cette analyse de en France, notamment au niveau national.
septembre 2010 à janvier 2011, en rencontrant
Les recommandations et propositions
les acteurs clés de la réutilisation des données
exprimées ne reflètent que les conclusions de
publiques, en prenant part à des colloques
l’analyse menée par les membres du groupe
internationaux, et en s’appuyant sur la
d’étude, et n’engagent en aucune manière leurs
bibliographie existante.
institutions, employeurs ou corps d’affectation.
Deux personnalités académiques expertes
de l’économie numérique et de ses nouveaux
Ecole des Ponts ParisTech 2011.
Les Données publiques au service de l’Innovation et de la Transparence.
Pour une politique ambitieuse de réutilisation des données publiques.
Rapport à la Délégation aux usages de l’Internet, juillet 2011.
Vous pouvez contacter les auteurs de ce rapport à l’adresse suivante :
rapport.opendata.2011@gmail.com
1
5.
6. Remerciements
Nous tenons à remercier vivement M. Nous souhaitons également remercier
Bernard Benhamou, Délégué aux Usages de l’équipe du Mastère d’Action Publique de
l’Internet, pour sa disponibilité, la confiance l’École des Ponts ParisTech pour l’opportunité
qu’il nous a témoignée, et ses conseils avisés et qu’elle nous a accordée : le directeur
constructifs. Nous tenons aussi à remercier Dominique Schwartz, le directeur adjoint
pour leur aide l’ensemble des équipes de la Vincent Spenlehauer et la secrétaire Sylvie
Délégation aux Usages de l’Internet. Berte.
Nous remercions également M. Pierre-Jean Nos remerciements s’adressent enfin à
Benghozi, Directeur de recherche au CNRS et l’ensemble des interlocuteurs qui nous ont
professeur d’économie à l’École reçus ou nous ont fait part de leurs réflexions
Polytechnique, et M. Laurent Gille, sur le sujet des données publiques, ainsi qu’à
enseignant-chercheur en sciences économiques toutes celles qui ont répondu à nos nombreuses
et sociales à Télécom ParisTech. Leurs questions.
conseils pertinents et le temps qu’ils nous ont
Toutes les erreurs ou omissions qui
consacré, tout au long de notre étude, nous ont
subsisteraient dans ce document ne sont le fait
été très précieux.
que de ses auteurs.
3
7.
8. Résumé analytique
Les évolutions technologiques récentes ont Une évolution du cadre législatif :
placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directives
cœur de l’action publique. en la matière, la directive « Informations du
secteur public » (PSI) en 2003 et la directive
L’administration collecte et produit un
INSPIRE en 2008. Une consultation publique
champ très vaste de données, depuis les
récente sur la directive PSI a notamment porté
budgets des institutions publiques jusqu’aux
sur l’opportunité de réviser son champ
mesures de la qualité de l’air que nous
d'application, les redevances et licences
respirons, en passant par des statistiques
relatives aux données, ainsi que les formats
précises sur notre économie, notre société et
électroniques utilisés.
nos territoires.
L’émergence de la notion politique de
Ouvrir l’accès le plus large aux
« Gouvernement Ouvert » : les politiques de
informations publiques, c’est tout d’abord
diffusion des données publiques ont fortement
améliorer la transparence de l’État et de ses
évolué dans les pays anglo-saxons du fait de
institutions, éclairer le débat démocratique, et
l’émergence de la notion d’Open Government,
rapprocher la puissance publique des citoyens.
thème de campagne du Président Barack
Favoriser la réutilisation de ces données Obama. Les États-Unis et la Grande Bretagne
(« l’Open Data »), c’est permettre à la ont créé des portails de données publiques
communauté des développeurs et des réutilisables, data.gov et data.gov.uk. En
entrepreneurs de leur inventer de nouveaux France, la mission Etalab vient d’être créée,
usages. C’est donc encourager l’innovation, et sous l’autorité du Premier ministre François
contribuer au développement des secteurs Fillon, pour coordonner les administrations en
stratégiques d’avenir, de l’économie matière de données publiques et mettre en
numérique au développement durable. place la future plateforme data.gouv.fr.
L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur de
opportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes,
virage de cette nouvelle dimension des issues de la société civile et des communautés
politiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir les
de l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien
d’associations et de fondations comme la
Une problématique au croisement des Sunlight Foundation aux États Unis, l’Open
évolutions technologiques, politiques et Knowledge Foundation (OKFN) en Grande
économiques récentes. Bretagne, et la FING, LiberTIC et Regards
La réutilisation des données publiques Citoyens en France.
constitue désormais une attente évidente de la La double rupture du Web 2.0 et des
société civile. Cette problématique nouvelle a technologies mobiles : les innovations de
émergé récemment au croisement de plusieurs service rendues possibles par les technologies
évolutions profondes. 2.0 (interfaces dynamiques, cartographie en
Une prise de conscience de la valeur ligne, ouverture des API) ont amené à la
économique de la réutilisation des données : généralisation du remix et du phénomène des
chaque année dans l'Union Européenne, la mashups de données. La nouvelle génération
réutilisation de données issues du secteur d’applications géolocalisées sur smartphones
public génèrerait un chiffre d'affaires de plus repose pour une part importante sur des
de 27 milliards d'euros. Pour Neelie Kroes, données géographiques. Ces ruptures
vice-présidente de la Commission européenne technologiques ont révélé le besoin croissant
chargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques.
grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrent
sont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de la
l'opportunité de modifier les règles de l'Union réutilisation des données publiques.
en matière de réutilisation, pour libérer
pleinement leur potentiel économique ».
5
9. Une opportunité majeure pour l’État et Une mise en œuvre complexe qui pourrait être
l’administration simplifiée
L’ouverture des données publiques permet Le cadre juridique est établi pour la
à des entrepreneurs, des chercheurs, des majorité des données publiques, mais les types
développeurs d’accéder aux données collectées de licences et contrats se multiplient. Le statut
dans le cadre du fonctionnement des des données issues d’organismes parapublics
administrations. reste à préciser. L’interopérabilité technique et
juridique est cruciale : il convient de clarifier
En les réutilisant, ils leur inventent de
les formats et les licences acceptables dans une
nouveaux usages et peuvent créer de nouvelles
optique d’encouragement à la réutilisation.
applications utiles aux citoyens. Cette
coproduction de services au public peut La gratuité pour la réutilisation des
constituer la base d’une nouvelle relation données à titre commercial favorise
numérique de l’administration à l’usager, et l’innovation et les nouveaux usages. Nous
d’un fonctionnement plus efficace de la préconisons donc de la généraliser le plus
puissance publique. possible, et d’éviter à tout prix la
multiplication et le maintien de redevances
L’ouverture des données publiques est de
excessives, qui pourrait conduire à des
plus un outil puissant d’amélioration de la
incohérences et freiner la réutilisation.
transparence de l’État. En donnant à tous les
citoyens qui le souhaitent accès aux détails du
Des risques surmontables
fonctionnement des institutions publiques,
cette ouverture nourrit et éclaire le débat Esquissée dans la loi 1978 sur l’accès aux
démocratique. Elle peut contribuer à baser les documents administratifs, consacrée par deux
choix politiques sur des analyses informées et directives européennes, la réutilisation des
ancrées dans le réel plutôt que des positions données publiques s’inscrit dans une évolution
idéologiques formulées a priori. durable de nos sociétés.
Enfin, un accès plus large aux données Elle induit une transformation de la culture
publiques peut contribuer à renforcer la et du mode de fonctionnement des
confiance des consommateurs, et donc la administrations. Des freins au changement
stabilité de notre économie. subsistent, et des risques peuvent émerger.
Rien n’indique cependant qu’ils ne puissent
Un outil stratégique pour notre économie être surmontés, surtout si l’État s’engage dans
une collaboration rapprochée avec la
Des conditions de réutilisation plus libres
communauté des réutilisateurs.
encourageraient l’innovation et pourraient
contribuer au développement de l’économie
Trois axes stratégiques pour favoriser la
numérique : les nouveaux services et réutilisation des données publiques
applications mobiles, qui en bénéficieraient
particulièrement, connaissent actuellement une Nous proposons les trois axes stratégiques
très forte croissance. L’économie numérique suivants pour favoriser la réutilisation des
est un facteur clé de croissance économique et données publiques et permettre à la société
de création d’emplois en France. d’en retirer l’ensemble des bénéfices attendus.
L’accès aux données publiques offre de Simplifier pour accélérer : réduire les
plus les prémisses d’une « infrastructure efforts nécessaires d’une part à la diffusion des
informationnelle », qui pourrait faciliter le données par les acteurs publics, et d’autre part
développement durable en permettant aux à leur réutilisation, afin d’accélérer le
consommateurs de faire des choix mieux développement de services utiles à partir des
informés. données publiques.
Enfin, la réutilisation des données Faciliter l’expérimentation : adapter les
publiques constitue un élément de soutien aux conditions de réutilisation des données
objectifs stratégiques d’investissement publiques pour faciliter l’expérimentation par
d’avenir pour l’économie française, de la les citoyens, les associations et la communauté
société numérique aux villes de demain et aux des développeurs et des entrepreneurs.
transports intelligents, en passant par Favoriser l’émergence d’un écosystème :
l’encouragement à la recherche scientifique et favoriser l’émergence d’un écosystème de
à l’innovation. producteurs et de réutilisateurs de données
publiques en France, autour de la mission
Etalab et du futur portail data.gouv.fr.
6
10. Seize propositions pour une politique nationale 7. Rendre la réutilisation des données
ambitieuse des données publiques gratuite pour toute réutilisation à titre
Ce rapport formule seize propositions, personnel.
articulées selon les trois axes stratégiques
précédents. Elles sont présentées de manière 8. Encadrer strictement les cas dans lesquels
détaillée au chapitre 8, et visent à proposer une une redevance est légitime, et charger les
feuille de route claire pour mettre en place une producteurs de données d’établir l’absolue
politique ambitieuse des données publiques. nécessité de toute tarification :
1. Formaliser les bonnes pratiques de • Dessaisir l’État du rôle de valorisation
diffusion des données publiques attendues des données publiques.
par la communauté des réutilisateurs : • Généraliser la gratuité pour les données
• Expliciter l’effort minimal attendu. nouvellement mises à disposition.
• Assurer la formation des agents et leur • Restreindre la tarification à coûts
accès à des guides synthétiques moyens aux marchés matures.
explicatifs.
• Simplifier les formats de diffusion. 9. Conditionner toute redevance pour
réutilisation de données à valeur ajoutée à la
2. Mettre en cohérence les conditions légales mise à disposition gratuite des données
de réutilisation des données issues de brutes qui les sous-tendent.
sources différentes :
• Etablir une licence gratuite par défaut. 10. Explorer des conditions alternatives de
• Encourager un marquage graphique des réutilisation pour laisser carte blanche à
droits de réutilisation. l’expérimentation :
• Explorer les licences gratuites avec
3. Encourager l’utilisation de formats partage des conditions initiales à
facilement réexploitables, qui respectent les l’identique (share alike).
normes d’interopérabilité et de « lisibilité • Explorer la rémunération par l’accès aux
machine » : métadonnées.
• Privilégier les formats ouverts respectant • Explorer la rémunération par le service
les normes d’interopérabilité. client.
• Communiquer sur l’importance des • Faciliter l’expérimentation avec les Web
formats réexploitables auprès des agents. Services.
• Maintenir une liste de formats
correspondants à ces critères. 11. Impliquer la communauté des
réutilisateurs autour de la plateforme
4. Faire en sorte que chaque contrat public data.gouv.fr :
clarifie à l’avenir les droits de réutilisation • Créer un point d’accès unique centralisé
liés aux données produites dans son cadre : et mis à jour automatiquement.
• Clarifier les droits de réutilisation de • Développer une offre grand public qui
données dans les contrats publics. mette en valeur des applications utiles.
• Etablir des bonnes pratiques et des • Investir dans l’accompagnement de la
clauses types. communauté.
• Elargir le périmètre des données • Démultiplier le service aux utilisateurs.
réutilisables aux ressources essentielles. • Organiser des séminaires ou ateliers de
travail ponctuels sur les sujets
techniques d’intérêt pour la
5. Faciliter l’enrichissement des données et communauté.
l’intégration de corrections éventuelles par
la communauté :
• Faciliter l’intégration des métadonnées. 12. Mettre en place des assises des données
• Permettre l’enrichissement collectif des publiques et animer la communauté des
jeux de données. réutilisateurs :
• Regrouper l’ensemble de l’écosystème
pour des assises des données publiques.
6. Impliquer des acteurs publics pilotes dans • Animer la communauté des
les projets de recherche sur le Web réutilisateurs.
sémantique.
7
11. 13. Encourager le développement • Faire des données et de leur réutilisation
d’applications à partir des données un outil d’éclairage du débat public.
publiques :
15. Développer une stratégie nationale à
• Organiser un concours national de
partir du rôle de coordination des
développement d’applications.
institutions publiques de la mission Etalab :
• Prendre en compte la réutilisation des
• Mutualiser des solutions de mise en
données publiques dans les appels à
ligne pour les administrations et les
projets de R&D numérique.
collectivités.
• Pérenniser l’offre d’applications créées à
• Développer une stratégie nationale pour
partir des données publiques.
les données publiques.
14. Intégrer les données publiques et leur
16. Elargir le champ de l’Open Data :
réutilisation au débat démocratique :
• Elargir le champ de la libre réutilisation
• Communiquer aux administrations
des données publiques.
l’importance des données pour mettre en
lumière leurs métiers. • Explorer l’application de l’Open Data
aux entreprises privées.
• Illustrer la réutilisation des données
publiques par le développement de • Développer une stratégie européenne et
services aux citoyens. internationale.
8
12. Table des matières
Résumé analytique 5
Table des matières 9
Introduction 11
Partie 1. « Open Data » : contexte et enjeux d’un sujet de société 15
Chapitre I. Les données publiques : émergence d’un sujet de société Erreur ! Signet non défini.
1. La donnée au cœur des nouveaux usages 17
2. Les données publiques et de leur réutilisation 19
Chapitre II. La libre réutilisation des données publiques à l’international 23
1. Le mouvement Open Data 23
2. États-Unis : initiatives locales, puis démarche fédérale 24
3. Grande Bretagne : une impulsion du gouvernement national sur fond d’alternance politique 26
4. Situations contrastées en Europe 28
Chapitre III. Les enjeux de la réutilisation des données publiques 31
1. Démocratie, transparence et débat public 31
2. Modernisation de l’État 32
3. Innovation et soutien à l’économie numérique 33
4. Des données stratégiques pour l’économie 36
5. Un nouveau mode d’action publique 40
Partie 2. État des lieux de la réutilisation des données publiques en France 45
Chapitre IV. Le cadre de la réutilisation des données publiques en France 47
1. Le cadre juridique pose en principe la liberté de réutilisation 47
2. Les acteurs de la réutilisation de données publiques 50
Chapitre V. Premières expériences d’ouverture des données publiques en France 55
1. La réutilisation des données dans les collectivités territoriales 55
2. L’ouverture des données au niveau national : trois études de cas 60
3. La mise en place d’une politique nationale des données publiques 63
Partie 3. Comment favoriser la réutilisation des données publiques ? 67
Chapitre VI. Abaisser les barrières à la réutilisation 69
1. Répondre aux contraintes techniques 69
2. Gérer la complexité juridique 70
3. Anticiper l’impact organisationnel 72
4. Modèles économiques propices à l’innovation 73
9
13. Chapitre VII. Prospective : Trois scénarios pour l’avenir 81
1. « Inertie » : Développement de l’offre de données publiques à son rythme historique 81
2. « Capture » : Des monopoles informationnels se substituent à la puissance publique 83
3. « Symbiose » : Catalyser le développement d’un écosystème 85
Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques 89
1. Simplifier pour accélérer 89
2. Faciliter l’expérimentation pour encourager l’innovation 92
3. Soutenir l’émergence d’un écosystème 93
Bibliographie 99
Textes règlementaires 103
Interlocuteurs 105
Liens et références 107
10
14. Introduction
« Si l’on partage des données sur le
Web, des données publiques, des données
scientifiques, des données citoyennes,
quelles qu’elles soient, d’autres que nous
sauront en tirer des créations merveilleuses
que nous n’aurions jamais imaginées. »
Tim Berners-Lee, Inventeur du Web
Hal Varian, Économiste en Chef chez Les applications en question vont des
Google, le précise : « Je répète sans cesse que services les plus simples aux plus complexes,
la profession sexy dans les dix prochaines de l’expérimentation au produit professionnel :
années, ce sera statisticien. Et ce n’est pas de des étudiants développent une application
l’humour.1 » mobile, des citoyens quantifient l’action de
leurs députés, des journalistes créent de
On peut émettre des réserves quant au
nouvelles infographies plus instructives, une
pouvoir de séduction d’un tableur
entreprise calcule des itinéraires de transports
informatique ; il reste que l’attrait de la science
publics au service des internautes.
des données s’est considérablement accru ces
dernières années. Ses algorithmes ont gagné en Les développements technologiques
puissance et ses applications jouent un rôle récents ont largement accéléré le
central dans la société de l’information. développement de ce phénomène, et les
attentes d’une partie du public sont aujourd’hui
À mesure que nos outils informatiques
très fortes.
deviennent plus mobiles, leurs applications
gagnent en importance dans nos vies
Une problématique nouvelle et complexe pour
quotidiennes. En recoupant des données le secteur public
numériques diverses, en les adaptant à notre
contexte d’usage à travers une ergonomie La réutilisation des données publiques offre
simple, les smartphones et les tablettes tactiles des possibilités nouvelles à la sphère publique.
simplifient bon nombre des tâches de la vie Elle appelle une évolution de la culture et du
quotidienne et professionnelle. mode de fonctionnement des administrations.
Elle soulève surtout de nombreuses questions.
La réutilisation des données publiques
Quelles opportunités ? Quels risques ?
Un mouvement de réutilisation des données Quelles pistes pour en faire profiter au mieux
publiques2 a vu le jour depuis plusieurs années. la société ? Quels enseignements tirer de
Concrètement, il s’agit pour des développeurs l’expérience d’autres pays en la matière ?
informatiques d’accéder à des données Quel(s) public(s) cette politique vise-t-elle,
produites initialement dans le cadre du avec quels objectifs et quels moyens ? Quelles
fonctionnement de l’État, et de leur inventer de limites et quelles garanties donner au droit à la
nouveaux usages. Tous types d’objets réutilisation ?
numériques sont concernés : des tableaux
chiffrés, des mesures numériques, des bases de Une opportunité importante pour le
données, des cartes ou bien des jeux de développement du numérique
données géolocalisées… Grâce aux réseaux mobiles à haut débit, la
connectivité devient ubiquitaire. Les nouvelles
plateformes mobiles permettent désormais
d’accéder en direct à des services ou des
1
Steve Lohr. 5 août 2009. « For Today’s Graduate, One informations dans le contexte dans lequel
Word: Statistics ». The New York Times. ceux-ci sont le plus utiles. Ces évolutions ont
http://www.nytimes.com/2009/08/06/technology/06stats.ht
ml
donné naissance à une industrie nouvelle et en
2
A l’exclusion bien sûr des données personnelles et des forte croissance, celle des applications
données confidentielles (loi de 1978 sur la liberté d’accés mobiles.
aux documents administratifs, modifiée par Ordonnance
n°2005-650 du 6 juin 2005).
11
15. Des acteurs internationaux du Web ont su La réutilisation des données publiques en
prendre des positions fortes sur ce marché. La France
France possède des atouts pour réussir dans ce Une deuxième partie fait ensuite le point
secteur. Faciliter l’accès aux données sur la réutilisation des données publiques en
publiques en vue d’une réutilisation France aujourd’hui (chapitre 4).
commerciale pourrait favoriser la création
d’activités économiques novatrices. Le chapitre suivant vise à fournir aux
agents publics des pistes et références à partir
Un débat passionné desquelles construire leur réflexion. Nous
cherchons en particulier à comprendre le
Opportunité de développement économique contexte de cette politique, son cadre juridique
et avancée en matière de transparence d’une et technique, et les acteurs qu’elle met en jeu
part, érosion potentielle de la capacité d’action (chapitre 5).
de l’État et de ses ressources propres de
l’autre : la tarification de la réutilisation des Comment favoriser la réutilisation des
données publiques est l’objet d’âpres débats, données publiques ?
quand elle ne donne pas lieu à des contentieux.
Le mouvement de réutilisation de données
L’ouverture des données elle-même pet étant durablement amorcé, il convient de
faire peur, quand ce n’est pas s’interroger sur les difficultés auxquelles il
l’incompréhension quant à l’intérêt d’un droit risque de se heurter dans l’administration, les
à la réutilisation de données qui interpelle. établissements publics et les collectivités :
difficultés d’ordre juridique, organisationnel,
Un mouvement engagé sur le long terme technique et financier. Nous abordons la
La mise à disposition des données question de la tarification optimale, et des
publiques pour leur réutilisation n’est pourtant modèles économiques qui doivent s’appliquent
pas un effet de mode : il s’agit d’un droit aux données publiques (chapitre 6).
opposable consacré par la loi, basé sur une A partir des dynamiques en présence, nous
Directive de 2003 que la Commission avons imaginé trois scénarios futurs pour la
Européenne envisage d’étendre et de renforcer. réutilisation des données publiques : l’Inertie,
Cette évolution engagée confronte chaque la Capture et la Symbiose. Nous détaillons les
administration centrale, chaque collectivité caractéristiques et les implications de chacun
locale, chaque établissement public à des de ces futurs possibles (chapitre 7).
questions difficiles. Qu’attend-on d’eux
exactement, et comment bien faire ? Conclusions et recommandations
Le scénario de la Symbiose et du
Contexte et enjeux d’un sujet de société développement d’un écosystème présente de
Le premier chapitre s’attèle à esquisser un loin le plus d’avantages : travailler à
portrait synthétique des grandes évolutions qui l’ouverture des données publiques en
ont amené la question des données publiques à collaboration avec la communauté de ceux qui
devenir, en l’espace de quelques années, un les réutilisent est une nécessité pragmatique
véritable sujet de société. Nous passons plus qu’un choix idéologique.
notamment en revue les évolutions Pour que la société puisse tirer l’ensemble
technologiques récentes qui l’ont portée sur le des bénéfices potentiels de la réutilisation des
devant de la scène (chapitre 1). données publiques, il convient cependant
Le second chapitre dresse un état des lieux d’encourager son développement au rythme le
de la réutilisation des données publiques en plus rapide.
2011 dans le monde, et un historique des Nous proposons enfin (chapitre 8) seize
évolutions récentes dans les pays occidentaux propositions groupées en trois axes
(chapitre 2). stratégiques, visant à établir une feuille de
Nous nous attachons ensuite à cerner les route claire vers une politique ambitieuse des
bénéfices que l’on peut attendre d’une données publiques.
politique de soutien à la réutilisation des Simplifier pour accélérer : réduire les
données publiques. Nous évoquons les enjeux efforts nécessaires d’une part à la diffusion des
liés à la participation démocratique et à données par les acteurs publics, et d’autre part
l’efficacité de l’action publique. Nous à leur réutilisation, afin d’accélérer le
explicitons les différents mécanismes à travers développement de services utiles à partir des
lesquels la donnée publique peut contribuer au données publiques.
développement économique (chapitre 3).
12
16. Faciliter l’expérimentation : adapter les Favoriser l’émergence d’un écosystème :
conditions de réutilisation des données favoriser l’émergence d’un écosystème de
publiques pour faciliter l’expérimentation par producteurs et de réutilisateurs de données
les citoyens, les associations et la communauté publiques en France, autour de la mission
des développeurs et des entrepreneurs. Etalab et du futur portail data.gouv.fr.
13
17.
18. Partie 1. « Open Data » : contexte et
enjeux d’un sujet de société
15
19.
20. Chapitre I. données publiques : émergence d’un
sujet de société
Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et le
rendu possible le partage rapide et aisé de tous référencement de documents en symbolisant
types de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liant
nouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer,
documents administratifs, maintenant sous effacer) et métadonnées d’adressage universel
forme électronique et bien plus aisément (URL ou Uniform Resource Locator5).
diffusables.
Bien que basées sur un réseau d’échange de
L’Internet a fait apparaître une économie documents, les techniques du Web ont
des données. Les stratégies de croissance des naturellement développé un tropisme de plus
acteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes.
interfaces de programmation (API), ont illustré L’introduction des bases de données
le potentiel de la réutilisation des données, et relationnelles dans les outils de développement
suscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est-
vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent aux
pression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listes
à leurs informations, s’insèrent et tiennent leur d’objets changeants, une de journaux
rang dans ce « Web des Données ». électroniques mise à jour fréquemment). A
partir de 2004, une technique émergente a vu
Ces ruptures technologiques ont
le jour qui consiste à utiliser les fonctionnalités
accompagné par ailleurs une prise de
de scripting6 présentes dans les navigateurs
conscience de l’importance des données
pour permettre la mise à jour en temps réel de
produites par l’administration et le secteur
pages déjà chargées, en allant chercher en
public. La possibilité novatrice de réutiliser ces
tâche de fond des données remises à jour.
données sous forme brute, pour leur inventer
Nommée AJAX7 pour JavaScript Asynchrone
de nouveaux usages utiles et instructifs, a
et XML (Asynchronous Javascript And XML),
abouti à l’émergence de la question des
à partir du langage de scripting JavaScript et
données publiques en tant que véritable sujet
du format d’échanges de données XML, cette
de société.
technique à la croisée de différentes
technologies Web est reconnaissable derrière
1. La donnée au cœur des des applications Web hautement réactives dont
les pages ont rarement besoin d’être rafraîchies
nouveaux usages – telles que GMail8, Quora9 ou Facebook10.
Internet et les ruptures technologiques
récentes on fait apparaître une nouvelle
« économie des données ». 5
World Wide Web Consortium (W3C). 1994. Uniform
Resource Locators (URL) : A Syntax for the Expression of
(i) Le Web est structuré autour de l’échange de Access Information of Objects on the Network.
données. http://www.w3.org/Addressing/URL/url-spec.txt
6
Capacité d’un navigateur à faire tourner dynamiquement
Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée.
dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur un
la manipulation algorithmique de structures de script qui demande au navigateur de mettre à jour l’heure,
les minutes et les secondes à mesure qu’elles s’écoulent.
représentation de données. Le Web, avant Dans le cas d’un service de courrier en ligne, c’est souvent
d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email et
architecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôt
chercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui
vérifie automatiquement l’arrivée de nouveau courrier en
énergies au CERN, Sir Tim Berners-Lee4. Elle
tâche de fond, et réintègre éventuellement ces nouvelles
données dans le corps de la page affichée.
3 7
World Wide Web Consortium (W3C), 2010, HTTP – Garrett, J.J. 18 février 2005. « Ajax : A New Approach
Hypertext Transfer Protocol Overview – draft 09. To Web Applications ».
http://www.w3.org/Protocols/ http://www.adaptivepath.com/ideas/essays/archives/00038
4
World Wide Web Consortium (W3C). Sir Tim Berners- 5.php
8
Lee: Bio. Téléchargée le 10 janvier 2011. GMail, service de boîte de courrier électronique en ligne
http://www.w3.org/People/Berners-Lee/ de Google, Inc. : http://www.gmail.com
17
21. Pour supporter cette technologie, de plus en système producteur voit sa position
plus d’applications en ligne ont développé à la compétitive renforcée par la dépendance
fois deux interfaces : une interface graphique accrue du marché à ses données. En l’essence,
classique accessible aux utilisateurs à travers c’est une transaction de marché où l’accès à
leur navigateur, et une interface exclusivement des données est échangé contre leur diffusion à
consacrée aux machines, qui permet justement un nouveau public ou dans un nouveau
au moteur de scripting du navigateur de contexte.
récupérer des données à la volée. C’est cette
L’exposition d’une interface API est
interface, qu’on peut se représenter comme un
aujourd’hui une étape presque obligée du
protocole d’échange de données de machine à
développement d’un nouveau produit en ligne.
machine, qu’on appelle interface de
La généralisation de ce phénomène est d’une
programmation ou API (sigle anglophone pour
grande importance pour la question des
Application Programming Interface).
données publiques, car elle a permis de prendre
conscience de l’omniprésence des données
(ii) La donnée, monnaie d’échange et levier
d’influence sur le Web. derrière les services qu’utilisent
quotidiennement les internautes.
Les API sont devenues un véritable outil
stratégique pour les sociétés de services en En un mot, « l’économie des données »
ligne.11 Par exemple, c’est dans une large s’est construite autour de l’échange et de la
mesure grâce à l’ouverture de leur API12 que fluidité sur le Web : les donnée ont souvent
Twitter a pu permettre à une communauté de plus de valeur comme outil d’échange et
développeurs de se créer, et de multiplier les d’influence qu’isolées au sein des entrepôts de
applications permettant d’utiliser le service en données des entreprises13.
dehors du site Web principal (notamment dans
les premiers jours de l’App Store d’Apple (iii) Avec le Web 2.0, la donnée devient
collective
durant l’été 2008). Ce grande nombre
d’applications a servi de « force de vente » Un corollaire de la montée en puissance de
virtuelle pour Twitter, et est un des facteurs la donnée est son rôle de liant social sur le
principaux qui expliquent son succès Web. En particulier, avec l’apparition de
populaire. phénomènes de collaboration de masse tels que
Wikipedia, on s’aperçoit que l’échelle
Bien documentées et basées sur des
d’échanges rendue possible par Internet ouvre
standards acceptés (tels que JSON ou XML)
des possibilités insoupçonnées jusqu’alors.
pour éviter les problèmes d’interopérabilité,
ces interfaces s’adressent à des développeurs Des services tels que Delicious (site de
informaticiens. Selon le degré d’ouverture partage de bookmarks, qui agrège les
(fonction des choix stratégiques de la société) catégories dans lesquelles les utilisateurs
et les conditions de licences (souvent conçues rangent différents liens, et permet ensuite de
pour encourager la réutilisation) consentis à trouver des liens par catégorie d’intérêt) ou
ces derniers, ils peuvent extraire, Flickr (qui permet de chercher des
éventuellement modifier, et transformer les photographies libres de droits sur un sujet
données du service Web en question, pour les particulier, en se basant sur les tags de
réutiliser, notamment à la construction de catégorisation produits par l’ensemble des
nouveaux services ou de nouvelles utilisateurs) ont ainsi profité de ce phénomène
applications. de folksonomy, la taxonomie par les foules ou
classification par l’intelligence collective14.
L’échange est mutuellement bénéfique : le
nouveau service, consommateur de données, D’autres services tels qu’Amazon ou
gagne en utilité pour ses utilisateurs, et le Netflix ont, eux, profité de la masse
d’utilisateurs se servant de leurs sites pour en
extraire des modèles de préférences des
9
Quora, Inc., site de questions et réponses dynamique
caractérisé par l’expertise pointue de sa communauté 13
Ed Parsons - Geospatial Technologist for Europe,
d’utilisateurs, fondé en 2009 et qui a connu une très forte
croissance en 2010 : http://www.quora.com Middle East and Africa chez Google, au séminaire
10
Facebook, Inc., le réseau social dominant qu’on ne « Innovations et développement du secteur de
présente plus, fondé par Mark Zuckerberg en 2004 et l’information géographique » organisé le 5 octobre 2009 à
approchant 600 millions d’utilisateurs début 2011 : la Grande Arche de la Défense par le Conseil National de
http://www.facebook.com l’Information Géographique (CNIG), l’AFIGÉO et
11
Shah S., 28 August 2010, « Cannibalize Business l’Institut des Sciences et des Techniques de l’Équipement
Development by Popularizing your API » :
pour le Développement (ISTED)
http://shaivalshah.com/cannabilize-business-development- 14
by-populariz Tapscott, D. and Williams, A. 2006. Wikinomics : How
12
Entretien avec Henri Verdier, Président de Cap Digital. Mass Collaboration Changes Everything.
18
22. consommateurs, qui leur permettent de faire plateforme, (…) l’une des facettes du design
des recommandations hautement collaboratif sur le Web17 ». Cette nouvelle
personnalisées selon les goûts de leurs clients. tendance a connu un tel succès au tournant des
années 2006 à 2008 que le prestigieux
L’un des enseignements de la nouvelle
Museum of Modern Art de New York y a
incarnation sociale et collaborative du Web,
consacré une exposition phare18.
c’est que la valeur des données n’est pas
intrinsèque, mais dérive de leur agrégation, de Au-delà de l’incidence culturelle de ce
leur recoupement, de leur analyse et de la phénomène19, la réappropriation du local et de
réutilisation qui en est faite. l’espace géographique par le biais du Web et
du mobile annonçait l’importance croissante de
Le Web a ainsi mis à jour une économie
la donnée informatique géographique, et, au-
des données, qui joue un rôle de monnaie
delà, l’émergence du phénomène culturel du
d’échange parmi les entreprises d’Internet et
remix et de la réutilisation des données.
les services en ligne.
(iv) Données géographiques et « mash-ups » 2. Les données publiques et de
L’autre développement technologique qui a leur réutilisation
mené à prendre conscience de l’importance des
données, c’est la démocratisation de La génération des digital natives, qui a
l’information géographique. grandi dans l’habitude de la réutilisation, du
remix et de la recombinaison permanente,
Google indique par exemple que son devait nécessairement s’intéresser aux
approche est « d’utiliser la géographie pour informations collectées par l’État.
organiser toute l’information mondiale, qu’elle L’émergence de la réutilisation des données
soit géographique ou non. C’est un principe publiques comme sujet de société, poussée par
d’organisation qui sera utilisé pour mieux les nouveaux usages, a révélé une chaîne de
comprendre l’information. »15. valeur fondée sur ces données qui, lorsqu’elles
Si les briques technologiques sont sont mises à disposition de façon brute et
disponibles pour utiliser et manipuler la réexploitable, permet aux développeurs et aux
donnée géographique à loisir, ou même pour entrepreneurs de créer de nouveaux services.
l’utiliser pour structurer d’autres données, le
défi qui reste posé est celui de la constitution (i) Les données numériques ont vocation à la
diffusion la plus large
d’une véritable infrastructure des données
géographiques. Ces données sont aujourd’hui Contrairement aux documents papiers dont
accessibles en nombre et de qualité, mais les l’impression engendre des coûts variables
repérer et les réutiliser peut rester obscur et conséquents et qui nécessitent des délais de
complexe16. traitement et d’acheminement, les données
numériques ont un coût marginal de diffusion
Conséquence récente des évolutions du
nul ou presque, et sont accessibles quasiment
Web, des applications cartographiques
instantanément.
puissantes réservées jusque là à des experts
sont devenues accessibles à tous. Le monde du Le travail éventuel de mise à disposition de
Web collaboratif a largement repris à son données numériques est donc un coût fixe : la
compte la possibilité de représenter des diffusion la plus large, en distribuant ce coût,
données sur des cartes. Grâce à l’ouverture est donc le modèle le plus efficace d’un point
gratuite (dans des limites relativement larges de vue économique.
de volume) de son API, Google Maps est
L’instantanéité de diffusion et l’ubiquité
devenu une base de choix pour la création de
d’accès offrent de plus des perspectives tout à
« mashups », ces applications Web combinant
fait nouvelles en terme de périmètre de
« différentes sources au sein d’une seule
diffusion et d’audience potentielle, notamment
15
Ed Parsons - Geospatial Technologist for Europe,
17
Middle East and Africa chez Google, au séminaire Google Earth mashups 5 of 14, in « Design and the
« Innovations et développement du secteur de Elastic Mind. » Museum of Modern Art. New York, NY.
l’information géographique » organisé le 5 octobre 2009 à 2008.
la Grande Arche de la Défense par le Conseil National de http://www.moma.org/interactives/exhibitions/2008/elastic
l’Information Géographique (CNIG), l’AFIGÉO et mind/#/98/
18
l’Institut des Sciences et des Techniques de l’Équipement « Design and the Elastic Mind. » Museum of Modern
pour le Développement (ISTED). Art. New York, NY. 2008.
16
Voir l’intervention de Max Craglia, coordonateur http://www.moma.org/interactives/exhibitions/2008/elastic
technique d’Inspire pour la Commission Européenne mind/
19
(centre commun de recherche) au séminaire du 5 octobre Lessig, L. 2009. Remix : Making art and commerce
2009 cité plus haut. thrive in the hybrid economy. http://remix.lessig.org/
19
23. au regard de la démocratisation de l’Internet l’information est estimé en France à 3,7
fixe avec un taux de pénétration qui s’élève à milliards d’euros dont 60% sont des données
plus de 70% de la population en France. publiques20. Au niveau européen, ce chiffre
représenterait près de 27 milliards d’euros21
(ii) Combiner les données brutes amplifie leur par an.
potentiel
La valorisation passe par différentes étapes
Marqué par les traditions et les habitudes nécessaires pour rendre les données publiques
d’un monde de communication par le papier, utilisables ou réutilisables. D’une part
l’État diffuse le plus souvent ses informations l’institution productrice doit définir
sous forme de « produits finis », tels que des précisément quelles données elle doit diffuser
analyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travail
rapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade
« retravaillées » afin d’être intelligible par le respect de critères de bon sens comme la
tous. A l’inverse, les données brutes qui sous- protection de la vie privée, de la propriété
tendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécurité
disposition du public, car leur intérêt pour une nationale.
réutilisation potentielle est encore très
inégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation,
données publiques. l’institution productrice doit s’assurer de
fournir une donnée qualifiée et mise à jour.
Aujourd’hui, les technologies de Pour cela, il semble important de créer des lots
l’information permettent une mise à de données cohérents et de s’assurer de la
disposition des données à l’état brut à coût nul. présence d’une légende et plus généralement
Loin d’être un obstacle à leur réutilisation de la présence des métadonnées.
ultérieurement à leur mise à disposition par
l’administration, leur caractère brut permet au Il faut les mettre à disposition via un
contraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogage
qui amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à disposition
de services impossibles à réaliser sans ces des données, encore faut-il qu’elle puissent
croisements. être découvertes et facilement accessibles
grâce à un portail de données publiques ou un
Par exemple, des mesures locales de bruit moteur de recherche.
permettent de mettre en perspective la
corrélation positive mesurée entre les dépenses Enfin, les données publiques numériques mises
énergétiques d’un ménage et son taux à disposition peuvent être réutilisées par la
d’équipement en doubles vitrages, paradoxale communauté des développeurs et des
au premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer de
organisé par la ville de Washington, D.C., des nouveaux usages. Ces données représentent
données sur les vols croisées avec les tracés aussi un outil interne au service des
des pistes cyclables ont aussi permis de créer administrations, qui peut leur permettre des
une carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et
efficaces.
Parce qu’elle favorise ces croisements et
ces combinaisons fertiles sur des sujets (iv) La visualisation de données joue un rôle
recoupant des champs extrêmement vastes de structurant
l’économie, de la société et de
Les données géographiques ont un rôle
l’environnement, la mise à disposition des
structurant dans la chaîne de valeur. Elles
données brutes de l’État et des collectivités est
rendent possible la spatialisation et la
un terreau fertile pour des réutilisateurs, qui
visualisation sur carte d’autres jeux de
peuvent inventer à ces données de nouveaux
données, notamment géolocalisées. Selon
usages.
l’Association Française pour l’Information
Géographique (AFIGÉO)22, 80% des
(iii) Les données publiques et leur réutilisation
sont à l’origine d’une chaîne de valeur
20
http://www.rgpp.modernisation.gouv.fr/index.php?id=51
L’État et le secteur public au sens large,
&tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas
dans le cadre de leurs opérations, touchent à
h=89b9c6970f
l’ensemble des secteurs de notre économie, 21
Dekkers, M. et al., 2006, « MEPSIR, Measuring Public
notre société et notre environnement. Les Sector Information Resources, Final Report of Study on
données qu’il collecte sont donc naturellement Exploitation of public sector information »,
riches et très variées ; certaines ont une forte http://ec.europa.eu/information_society/policy/psi/docs/pdf
s/mepsir/final_report.pdf
valeur économique. Le marché de 22
http://www.afigeo.asso.fr/
20
24. informations qui sont utilisées possèdent une De manière plus générale, le succès de
dimension géographique. Cela leur confère l’infographie en ligne et des nouveaux modes
donc une importance particulière à la fois d’un de visualisation dynamique ont amené les
point de vue technique, mais aussi en tant graphistes et designers à rechercher de
qu’outil de recoupement et de recombinaison nouvelles informations et de nouvelles sources
de données. de données à mettre en scène dans leurs
productions.
Un exemple historique : en 1854, John
Snow détermina les causes de la propagation Le processus de recherche, d’analyse puis
du choléra grâce à la visualisation de données de représentation graphique synthétique des
sur une carte. A cette époque, on pensait que la données sous forme interactive, qui
maladie se propageait par inhalation. Le s’apparente à du journalisme et qu’on appelle
médecin superposa sur une carte les adresses parfois « datajournalisme » ou journalisme de
des victimes du cholera à Exeter (quartier de données, a participé à créer une demande pour
Londres) durant un épisode aigu, et constata plus de transparence de la part des
qu’elles coïncidaient avec l’accès à la pompe à gouvernements, et à l’émergence du sujet de la
eau de la Broad Street. Par déduction il en réutilisation des données publiques.
conclut au rôle de l’eau et des conditions
sanitaires dans la propagation de l’épidémie, ce
***
qui permit de la contrôler, et de réduire
drastiquement le taux de mortalité lié à cette Les données publiques offrent, par le biais
pathologie dans les décennies qui suivirent. des réutilisations qui peuvent en être faites, un
fort potentiel d’innovation, tant à titre
commercial que pour la recherche, le
développement de nouveaux services aux
citoyens ou l’amélioration du travail de
l’administration.
Les nouvelles possibilités de
recombinaison et de réutilisation offertes par
les technologies de l’information ont révélé
l’importance de leur réutilisation, et contribué
à en faire un sujet de société.
21
25. Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter.
22
26. Chapitre II. La libre réutilisation des données
publiques à l’international
Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à la
publiques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répand
d’informations publiques sous forme brute a largement au sein de la communauté des
émergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans la
technologiques et économiques de ces communauté des développeurs, notamment
dernières années. parmi les contributeurs de projets Open
Source, dont le mouvement d’ouverture des
C’est pourtant par deux ruptures politiques,
données est philosophiquement proche.
au plus haut niveau de l’État, d’abord aux
États-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et des
fois dans un contexte d’alternance politique, économistes de l’information créent ainsi
qu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) en
ambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)24 en
2006 – organismes à but non lucratif qui
Le chapitre suivant présente un tour
cherchent à promouvoir l’adoption de normes
d’horizon de ce mouvement d’appel à
mondiales de formats et de métadonnées
l’ouverture des données publiques, et
(description des jeux de données), et le
l’historique récent de ces deux principales
développement de solutions open-source pour
initiatives gouvernementales, qui l’ont
mutualiser les outils de mise en ligne de
concrétisé à l’international.
données.
Les promoteurs de l’Open Data ont ainsi
1. Le mouvement Open Data développé des définitions formelles des
Le terme Open Data, littéralement données critères qui caractérisent des données
ouvertes ou données libres (au sens de libre de « ouvertes ». Un groupe de travail « Open
droits), est utilisé pour désigner des données en Government Data » (OGD) d’experts du Web
libre accès et ouvertes à la réutilisation. Il s’est par exemplepour fixer huit critères assez
trouve son origine en 1995 dans une larges de définition des données publiques
publication du Comité sur les Données ouvertes25. L’Open Knowledge Foundation
géophysiques et environnementales du Conseil (OKFN), pour sa part, propose onze critères26,
national de la Recherche aux États-Unis plus axé sur les conditions juridiques
intitulée « De l’échange complet et ouvert des acceptables qui doivent se retrouver dans la
données scientifiques »23 : licence de réutilisation.
« Les programmes internationaux de Les deux ensembles de critères, qui
recherche sur le changement global et la établissent une première définition des données
surveillance environnementale dépendent du ouvertes, sont détaillés ci-dessous.
principe d’un échange complet et ouvert des Données complètes : toutes les données
données (i.e. les données et les informations sont mises à disposition, sauf exceptions de
sont rendues disponibles sans restriction, sur bon sens.
une base non discriminatoire, pour un coût
réduit à celui des besoins de reproduction et de Données brutes : les données sont telles
distribution). » que collectées à la source. Elles ont la plus fine
granularité possible et ne se présentent pas
Le terme, qui désigne donc à l’origine le sous des formes agrégées ou modifiées.
processus de collaboration des scientifiques
autour de données d’expériences partagées afin Données récentes : les données sont mises
de multiplier les chances de détecter des en ligne aussi rapidement que possible.
erreurs, se tenir mutuellement au courant des
23 24
http://www.opendatafoundation.org/
25
http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles
26
ummary.html http://www.opendefinition.org/okd/
23
27. Données accessibles : les données sont public) et l’opportunité politique ont mené au
accessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande-
possible, et réutilisables pour des usages les Bretagne et en Europe notamment, d’initiatives
plus variés. majeures d’ouverture et de réutilisation des
données publiques.
Données libres de droits : les données ne
sont pas soumises au droit d’auteur, à brevet,
au droit des marques, ou au secret commercial. 2. États-Unis : initiatives
Formats exploitables : les données sont locales, puis démarche
structurées pour permettre le traitement
automatisé, et disponibles sous une forme
fédérale
pratique et modifiable. L’ouverture des données s’est effectuée
aux États-Unis du bas vers le haut. Les villes
Formats non propriétaires : les données
de Washington, New York, San Francisco, ont
sont accessibles dans un format sur lequel
entrepris de recenser les collections de données
aucune entité n’a de contrôle exclusif.
qu’elles envisagent de mettre à disposition,
Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettre
données sont accessibles à quiconque sans ces collections de données à la disposition du
aucune obligation préalable ni inscription, et public des entreprises, des développeurs et des
sans discrimination entre les domaines citoyens.
d’application. Les données sont notamment
Ces démarches de « libération » des
disponibles aussi bien pour des réutilisations
données publiques sont très souvent
commerciales que personnelles.
accompagnées de concours d’applications pour
Paternité : la licence peut exiger, comme encourager la réutilisation des données rendues
condition pour la redistribution et la publiques.
réutilisation des données, d’identifier
Ce mouvement, amorcé par les grandes
clairement les créateurs de l’œuvre ou les
métropoles, fait désormais l’objet d’une
contributeurs initiaux. Si cette condition est
politique au niveau fédéral.
imposée, elle ne doit pas être indûment
complexe à remplir, et notamment la liste des
(i) La réutilisation des données émerge dans
contributeurs à citer doit être clairement les grandes métropoles.
indiquée.
L’année 2005 est marquée par une rupture
Distribution de la licence : les droits majeure : l’ouverture par Google des
attachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) du
à qui elles sont distribuées. service Google Maps donne lieu à une
Non transitivité de la licence : la licence ne floraison d’applications et de mashups27 . Un
peut exiger que toute donnée distribuée grand nombre de ces applications consistent à
conjointement avec une donnée sous licence positionner sur les cartes Google Maps des
libre soit aussi elle-même sous licence libre, ce données d’origine publique.
qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adrian
données. Holovaty, journaliste et programmeur28 lance
Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne sur
extraites d’une collection, les utilisateurs de une carte les données relatives aux crimes et
l’extrait doivent bénéficier des mêmes droits délits commis dans la ville et récupérées
que ceux qui sont accordés à la collection dans auprès de la municipalité29. Suite au succès de
son ensemble. l’application, et grâce à un don d’un million de
dollars de la Knight Foundation30 en 2007, il
Bien que ce modèle des données ouvertes développe une version commerciale du site,
puisse s’appliquer à tous types de données,
qu’elle soient produites par le secteur public ou 27
« Applications web combinant différentes sources au
non, l’importance démocratique de l’accès aux sein d’une seule plateforme, (…) l’une des facettes du
informations publiques a conduit à focaliser le design collaboratif sur le web ». Voir section 3.3.4.
28
débat sur l’Open Government Data, ou la Auteur de la librairie de développement en langage
Python à succès, Django.
réutilisation des données publiques. 29
Entretien avec Sylvain Parasie, LATTS, Ecole des Ponts
ParisTech.
Les évolutions technologiques, le cadre 30
Organisation caritative dédiée aux avancées dans le
réglementaire (notamment les lois sur le droit à domaine du journalisme. Ce type d’acteurs dotés en fonds
l’information et la Directive européenne sur la et organisés pour soutenir des programmes d’action ciblés,
réutilisation des informations du secteur reste rare en France mais joue un rôle important dans le
débat social aux États-Unis.
24
28. EveryBlock31 (pour « chaque pâté de Gouvernement Ouvert). Il assigne aux services
maison »), qui recense et agrège un grand fédéraux américains trois objectifs :
nombre de données potentiellement utiles pour transparence, implication des citoyens,
les citoyens dans un plusieurs municipalités. et collaboration.
Des services du même type, conçus à partir Adrian Fenty, le maire de Washington,
de données publiques des municipalités voient D.C. à l’époque, recommande Vivek Kundra
le jour dans les domaines de l’Éducation, de au Président Obama : le 5 mars 2009, ce
l’environnement ou de la santé. dernier est nommé Chief Information Officer
du gouvernement fédéral américain (Directeur
(ii) Succès médiatique des concours des Systèmes d’Information), un poste
d’applications. nouveau et symbolique créé sur mesure, avec
Vivek Kundra, responsable des systèmes pour mission de mettre en place les
d’information du District de Columbia technologies pour concrétiser la vision
(autorité administrative de la ville de politique du chef de l’exécutif.
Washington), s’empare en 2008 du sujet Il
(iv) Le portail fédéral Data.gov
lance Apps for Democracy, un concours de
développement d’applications de service Dès le 11 mars, Vivek Kundra demande
public, ouvert à tous les développeurs, libres aux DSI de toutes les agences fédérales
de s’approprier des jeux de données mis à leur américaines de désigner des ensembles de
disposition pour l’occasion32. données (« datasets ») susceptibles d’être mis
Contre toute attente, le concours en ligne. Se basant sur son expérience à
d’application, doté par la Mairie d’un prix de Washington, il se concentre sur les données
50 000 dollars, connaît un succès considérable. brutes. Data.gov sera un point focal faisant
Alors qu’ils espéraient une dizaine de autorité pour diffuser les données publiques
réponses, les organisateurs reçurent 47 brutes, sous des formats réexploitables.
dossiers en 30 jours seulement. Le coût estimé Son équipe développe une première version
du travail de conception et de programmation beta du site en trois mois, grâce à l’utilisation
ainsi mis à disposition des habitants de de techniques de développement dites
Washington a été évalué à plus de 2 600 000 « agiles » qui découpent la réalisation du
dollars, soit un retour sur investissement de produit en cycles rapides (de vingt-quatre
5100 % et un effet de levier de 52 pour 1. heures à quelques jours).
Apps for Democracy fait école : les Cette méthodologie aboutit à un processus
concours d’applications essaiment au sein des de développement rapide et itératif, qui assure
grandes métropoles américaines (notamment une rapidité de développement et la possibilité
New York, San Francisco, et Vancouver au d’intégrer continuellement les évolutions des
Canada)33. En 2010, la Banque Mondiale elle- besoins qui apparaissent très fréquemment
même lance son concours (Apps for dans le cadre de projets de développement
Development), qui reçoit plus d’une centaine logiciel : « commencer petit à petit, réfléchir
de contributions. vite, faire un premier jet, le construire de façon
incrémentale, prendre du recul. Trouver un
(iii) Le « gouvernement ouvert » du moyen pour avancer »34.
Président Obama
Le site est mis en ligne le 21 mai 2009, 120
Le candidat Barack Obama avait fait du jours seulement après la signature du
« Gouvernement ouvert » un des axes de son Mémorandum par le Président avec seulement
programme. Le 21 janvier 2009, au lendemain 47 ensembles de données. Le portail connaît
de sa cérémonie d’investiture, le Président dans les mois suivants une évolution très
Obama signe son premier acte politique : un rapide. Lors du premier anniversaire, en mai
mémorandum à destination des ministres et 2010, l’équipe de Data.gov annonçait35 :
directeurs d’agences intitulé « Transparency
and Open Government » (Transparence et • 250 000 jeux de données uniques en
ligne ;
31
EveryBlock.com est désormais une filiale de MSNBC.
http://www.everyblock.com/
32
Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.
34
Harvard Business School. Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.
http://www.data.gov/documents/hbs_datagov_case_study. Harvard Business School (voir plus haut).
35
pdf The White House. 21 mai 2010. « Data.gov : Pretty
33
Bernard Benhamou. 2010. « Les Concours Advanced for a One Year Old ».
d’Applications Mobiles dans le Monde », note de la http://www.whitehouse.gov/blog/2010/05/21/datagov-
Délégation aux Usages de l’Internet. pretty-advanced-a-one-year-old
25
29. • Plus de 97 millions de hits en 1 an, britanniques serait à elle seule une avancée
soit près de 2 millions de visites ; majeure36.
• Plus d’un millier d’applications listées « L’aspect le plus fascinant du Web c’est
construites à partir des «ensembles de que, quand vous mettez quelque chose en ligne,
données » mis à disposition des vous ne savez pas qui va l’utiliser – mais vous
développeurs. savez que quelqu’un va l’utiliser. »
Quelques enseignements peuvent être tirés Si ces données – performances scolaires,
de cette expérience : localisation des adresses postales, météo, et
• La demande pour des données surtout les cartes – étaient mises en ligne,
publiques brutes est très marquée ; explique-t-il, chacun y trouvera une utilité.37
• L’intérêt du public est variable selon Avec le Professeur Nigel Shadbolt,
les types de données, mais difficile à chercheur reconnu dans les technologies du
prévoir a priori ; Web sémantique, Tim Berners-Lee se voit
• La rapidité de mise à disposition des alors chargé d’accompagner les efforts de mise
données, sous forme brute et en ligne d’un portail d’informations publiques
réexploitable, a créé les conditions du sur le modèle du Data.gov américain,
succès ; Data.Gov.uk. Une premiére version du portail
• Les fonctionnalités d’abord limitées est ouverte le 30 septembre 200938,
de la plateforme n’ont pas empêché préfigurant le concours d’idées civiques Show
une expansion rapide par la suite ; Us A Better Way39. En parallèle, s’amorce un
• Les résistances à l’ouverture des mouvement de mise en ligne de données
données ont pu être dépassées par un géographiques, dont une grande partie a été
appui politique de premier ordre, et le rendue gratuite, une révolution pour
rôle de démonstrateur joué par la l’Ordnance Survey, l’institut géographique
première version beta de la national britannique40.
plateforme.
(ii) Un mieux-disant politique autour de la
mise en ligne des données publiques
3. Grande Bretagne : une
Le thème acquiert une visibilité politique à
impulsion du gouvernement l’occasion des élections parlementaires de mai
national sur fond d’alternance 2010. En réaction au retentissement médiatique
politique du scandale des notes de frais des
parlementaires à l’été 2009, le thème de la
L’initiative britannique a pris corps sous le transparence et celui de l’ouverture des
gouvernement de Gordon Brown : elle a été données publiques figure dans le programme
reconduite et même amplifiée par le
gouvernement Cameron. L’annonce le 12 36
Tom Chatfield and James Crabtree. 27 janvier
janvier 2011 de la création prochaine de la UK 2010. « Mash the state : opening up public sector data is an
Public Data Corporation (agence britannique old geek hobbyhorse, but could the man who invented the
web reinvent the British government ? ». Prospect
pour les données publiques) est une première.
Magazine.
http://www.prospectmagazine.co.uk/2010/01/mash-the-
(i) Une genèse qui doit au hasard state/
37
Texte original, tiré de l’article de Chatfield et Crabtree
Sir Tim Berners-Lee, inventeur du Web en cité plus haut :
1989 et artisan de l’émergence du « Web As Berners-Lee explains: « The thing people are
sémantique » a joué un rôle essentiel. Son amazed about with the web is that, when you put
something online, you don’t know who is going to
appel à mettre en ligne les données publiques use it—but it does get used. » So his pitch to
brutes lors de la conférence TED en 2009 avait Gordon Brown was simple: if this data—exam
reçu un écho important dans le monde results, postbox locations, weather reports, and
numérique, notamment d’un des principaux most crucially, maps—was put online, people
would find a use for it.
journaux britanniques, le Guardian, qui avait 38
« Sneak Peek Site Open ». 30 septembre 2009.
fait campagne pour l’ouverture des données Data.gov.uk Blog. http://data.gov.uk/blog/sneak-peek-site-
publiques (« Free Our Data »). open
39
« What would you create with public information ? » 20
A Gordon Brown qui l’interrogeait début janvier 2010. Show Us A Better Way Blog.
2009 sur les mesures phares qu’il pourrait http://webarchive.nationalarchives.gov.uk/2010080700435
prendre pour faire progresser le numérique 0/http://showusabetterway.co.uk
40
Great Brittan’s Ordnance Survey Annual report 2009.
britannique, Tim Berners-Lee avait répondu http://www.ordnancesurvey.co.uk/oswebsite/aboutus/repor
que la mise en ligne des données publiques ts/annualreport/09-
10/os_annual_report_and_accounts_2010.pdf
26