Une enquête sociologique dans les coulisses de l’open data

Depuis maintenant presque une dizaine d’années, les politiques d’ouverture des données publiques (open data) ont conduit à la publication de jeux de données extrêmement variés par des États, des villes, des institutions internationales, et parfois des entreprises. Ces données, librement réutilisables par tous et généralement gratuites, sont souvent présentées comme la source d’un renouvellement de la transparence et les instruments d’une nouvelle accountability institutionnelle. Pour certains, elles pourraient aussi devenir des ressources majeures pour l’innovation ; par exemple, le cabinet McKinsey a estimé les retombées d’une ouverture des données généralisées à trois milliards de dollars par an dans le monde . Enfin, pour d’autres, ces données pourraient servir de vecteur à une transformation des pratiques administratives. En 2013, les dirigeants des huit pays les plus riches du monde, lors de la réunion du G8 en Irlande du Nord, ont adopté une charte sur l’open data dans laquelle ils s’engagent à ce que l’ouverture des données devienne la pratique par défaut des administrations des pays signataires. Aujourd’hui, selon la dernière version du classement Open Data Barometer de la Web Foundation , 51 gouvernements dans le monde ont adopté une politique d’open data. Les attentes suscitées par l’ouverture des données publiques sont donc très fortes et plusieurs gouvernements se sont engagés en faveur de sa généralisation.

D’un point de vue plus personnel, j’ai commencé à travailler sur le sujet en 2010 dans le cadre d’un mémoire de fin d’études au Celsa, l’école de communication de la Sorbonne. Le 29 novembre 2010, je me rendais à Rennes pour assister à une rencontre internationale qui se tenait dans l’hémicycle de la Métropole, intitulée « Open Data and Reuse: what is happening at local levels in Europe? » La conférence était organisée par ePSI Platform, un organisme créé par la Commission européenne pour promouvoir la réutilisation des données publiques et la Fondation Internet Nouvelle Génération (FING), un acteur associatif majeur sur les sujets numériques. Daniel Kaplan, le directeur de la FING, avait clôturé la rencontre en faisant un bilan de la journée et en invitant les participants, pour la plupart travaillant dans des collectivités locales, à ouvrir leurs données. J’avais été à l’époque très intrigué par ses propos dont j’ai pu retrouver un enregistrement .

« Ce n’est pas souvent que les acteurs publics se retrouvent face à une opportunité pareille. Vous êtes assis sur… enfin vous avez déjà un stock de données que vous produisez de fait parce que vous faites votre boulot, vous prenez des décisions, vous menez des études, vous représentez graphiquement ou informatiquement votre territoire, parce que vous coordonnez un certain nombre d’activités ou de services… Donc elles sont là et il se trouve qu’il y a des gens qui vous les demandent. Il se trouve qu’en les donnant, ça peut produire un peu de croissance ou de meilleurs services, ça peut répondre à un certain nombre d’attentes citoyennes ou d’associations ou de médias. Ça peut produire des connaissances auxquelles personne n’avait accès. C’est quand même cadeau cette histoire. Alors c’est évidemment un peu moins simple au quotidien, mais c’est quand même cadeau. Vous n’avez pas autant d’opportunités que ça qui vous passent sous la main et qui, somme toute, vous ne coûtent pas si cher que ça dans la période actuelle. Et ça, je pense que c’est quand même le point de départ. Ensuite, quand on va commencer à s’y coller, ce sera quand même moins rigolo. On va devoir parler de licence, il va falloir discuter avec des informaticiens, mais le point de départ c’est quand même une opportunité extraordinaire et ce n’est pas si compliqué que ça et pas si coûteux que ça. »

Ce discours offre un excellent point de départ pour mener une enquête sur les politiques d’open data qui semblent se répandre partout dans le monde et concerner des administrations à tous les niveaux, mais sur lesquelles on ne sait finalement que peu de choses sur leurs origines et les conditions de leur mise en œuvre concrète dans les administrations.

Premièrement, Daniel Kaplan évoque dans son discours que l’ouverture des données est « une opportunité extraordinaire » qui permettrait de produire de la croissance, des services ou de nouvelles connaissances. Si, à travers son discours, on aperçoit que les bénéfices possibles de l’ouverture des données semblent clairement établis, on a plus de mal à voir quels en sont ses grands principes. Daniel Kaplan avait résumé les demandes essentielles des revendications de l’ouverture des données sur InternetActu.net, le site de prospective de la FING, dans un article qui tente d’imaginer les conséquences possibles d’une généralisation de l’open data à l’ensemble des administrations publiques : « Imaginons que nous avons gagné : une part très significative des “données de service public” sont désormais accessibles et réutilisables, brutes, en un format lisible par des machines, à un coût faible, voire (le plus souvent) nul. » On voit à travers cet extrait que l’ouverture ne signifie pas seulement la publication des données ; pour certains, ces données doivent être « brutes », « de service public », « lisible par les machines » ou à « faible coût. » Mais existe-t-il vraiment un consensus autour d’une définition de l’ouverture des données ? Qui sont les acteurs qui ont formulé ces revendications ? Et comment les ont-ils formulées ? Leurs demandes se rejoignent-elles ou voit-on apparaitre des lignes de tension entre ces acteurs ? Et, par ailleurs, comment ces demandes ont-elles été traduites en politiques publiques ? Quelles transformations ces revendications ont-elles provoquées dans les pratiques de publication des informations publiques ? Et, plus fondamentalement, qu’est-ce qui change lorsqu’on réclame des données ? Dans cette enquête, je vais d’abord tenter de retracer la généalogie de ce que les acteurs qualifiaient de « principes de l’open data » et de reconstituer comment ils ont été traduits plus localement en France dans des politiques publiques.

Pour répondre à cette première série de questions, je me suis appuyé sur des sources publiques en ligne, issues en particulier des archives du web (Schafer & Thierry, 2015) et des listes de diffusion (Akrich, 2012) dans lesquelles ont été débattues les définitions de l’open data. En plus de rejoindre des convictions personnelles, ma « participation observante » à l’Open Knowledge Foundation, a aussi constitué une source précieuse d’informations sur les pratiques émergentes de l’open data. En effet, au début de cette thèse, j’ai choisi de participer avec quelques uns à la création du chapitre français de l’Open Knowledge Foundation , une organisation qui, nous le verrons, a joué un rôle majeur dans la définition et le développement de l’open data. Par ailleurs, je me suis appuyé sur certains auteurs qui ont retracé l’émergence d’un droit de réutilisation des informations publiques (Ronai, 1997 ; Boustany, 2013 ; Trojette, 2013), l’histoire des mouvements se revendiquant de l’ouverture (Kelty, 2008 ; Strasser, 2011 ; Tkacz, 2012 ; Russell, 2014) et l’apparition de la notion d’Open Governement Data (Yu & Robinson, 2012).

Table des matières

Introduction
L’invention de l’open data : retour sur six moments de définition
Episode 1, « Open Definition » : des droits de l’usager d’un savoir ouvert
Episode 2, « Sebastopol » : l’ouverture exhaustive des données primaires
Episode 3, « Raw Data Now » : l’entrée en politique des données « brutes »
Episode 4, « 5-star model » : des formats ouverts et lisibles par les machines
Episode 5, « Open Data Index » : un score d’ouverture et des données « essentielles »
Episode 6, « G8 » : la reconnaissance de données à forte valeur
Conclusion
Vers une administration des données : la trajectoire d’Etalab
Le renvoi de l’APIE : un virage de la politique gouvernementale en faveur de la gratuité
Etalab : un engagement affiché en faveur de « l’open data »
L’alternance : Etalab sur la sellette
La refonte de data.gouv.fr : « faire vivre » les données
L’administrateur général des données : de l’ouverture à la « gouvernance » des données
Conclusion
L’identification : la découverte progressive et collective des données
L’utopie de l’inventaire exhaustif
L’exploration de l’organisation
Le ciblage des usages
L’organisation d’un réseau
Conclusion
Les frictions de l’identification : quelques « bonnes raisons
organisationnelles » de ne pas ouvrir des données
L’extraction : des assemblages de données à défaire
La qualité : des données qui n’ont pas été conçues pour leur ouverture
La sécurité : anticiper les dangers de la réutilisation
La transparence : un mandat à obtenir
Conclusion
Transformations et transmutations : la fabrique des données brutes
Convertir
Structurer
Editer
Conclusion
L’instauration des publics de données
Les métadonnées : réduire les frictions de l’ouverture et de la réutilisation
La visualisation : transformer les données pour les rendre intelligibles à un plus large public
Les assemblages temporaires des concours de réutilisation de données
Conclusion
Conclusion

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *