Passer au contenu

Open data libère les infos de l’administration

Enthousiasmante et prometteuse, la mise en ligne des données produites par les administrations soulève des questions qui trouvent peu à peu leur réponse.

A Rennes, les handicapés en fauteuil roulant peuvent se déplacer plus facilement. Le site Handimap (www.handimap.org) calcule le meilleur itinéraire selon l’emplacement des passages piétons et des hauteurs de trottoir. Un site pratique dont la réalisation a été possible grâce à la mise à disposition, par la ville, d’informations relatives à la voirie, sous la forme de fichiers informatiques téléchargeables. Le cas illustre ce que l’on appelle l’ouverture des données publiques, ou encore l’Open data, un mouvement né dans les pays anglo-saxons. L’idée est la suivante : les ministères, collectivités locales, organismes publics produisent de nombreuses données sous forme numérique. Statistiques, plans géographiques, inventaires, rapports, horaires, photos, catalogues, budgets, mesures… un gisement insoupçonné d’informations dont l’usage reste cantonné à l’administration. L’Open data veut “ libérer ” ces données publiques, c’est-à-dire les rendre accessibles et utilisables par tous, par le biais d’Internet. Deux objectifs motivent cette décision. Le premier est démocratique : il s’agit de répondre aux exigences de transparence du fonctionnement des institutions. Au Royaume-Uni, les citoyens britanniques peuvent ainsi, sur le site wheredoesmymoneyGo.org, visualiser comment leurs impôts sont dépensés. En France, l’association Regards citoyens, à partir des informations publiées sur le site de l’Assemblée nationale, retrace l’activité de chaque député (présence, rôle dans les commissions, interventions en séance, etc.), sur le site www.nosdeputes.fr.

Nouveaux services, création d’emplois

Le second objectif est économique. Des entreprises, à partir des données publiques, vont pouvoir créer et commercialiser des services, par exemple sous la forme d’applications pour smartphone, et générer ainsi des emplois. Pour l’Etat et les collectivités, cela permet de voir émerger des services dont ils n’auraient eu ni l’idée ni les moyens de produire en interne. Entre perspectives démocratiques et économiques, l’Open data semble donc prometteur et ne manque pas de partisans enthousiastes, comme Tim Berners-Lee, l’inventeur du Web.Concrètement, où en est-on ? Les Etats-Unis en 2009 et le Royaume-Uni en 2010 ont été les premiers pays à placer en ligne la production de leurs administrations, respectivement sur les sites Data.gov et Data.gov.uk. En France, l’ouverture des données débute seulement. Rennes (www.data.rennes-metropole.fr) et Paris (http://opendata.paris.fr), villes pionnières en la matière, ont démarré leur projet l’an dernier tandis que le gouvernement français prévoit le lancement du portail Data.gouv.fr en décembre. Les projets avancent lentement : si le principe de l’Open data est simple, sa mise en pratique est délicate et soulève plusieurs questions. Quelles données publiques libérer ? A priori, toutes sont susceptibles de l’être, sans distinction. La seule restriction qui saurait s’appliquer relève de la législation. Ainsi, aucune information nominative n’est concernée pour le moment. Rennes a publié d’abord les données relatives aux transports et à la voirie. Ont suivi les budgets de la municipalité, au nom de la transparence des institutions.

Priorité aux formats lisibles facilement

Au niveau de l’Etat français, un coordinateur présent dans chaque ministère inventorie les fichiers candidats. Toutefois, la loi française prévoit une exception pour les établissements publics à vocation industrielle ou commerciale. La SNCF et la RATP faisant partie de la liste, elles n’ont donc pas d’obligation à publier leurs données. En revanche, les entreprises ayant reçu délégation de services publics y sont tenues.Dans la pratique, le choix de libérer telles ou telles données se heurte à une considération technique. Dans quels formats rendre disponibles les fichiers informatiques ? En priorité, des formats lisibles et manipulables avec des logiciels gratuits, et qui ne soient pas, si possible, la propriété d’une entreprise commerciale. Ainsi le format Excel, lisible avec OpenOffice mais propriété de Microsoft, est toléré. La circulaire gouvernementale du 26 mai 2011 rappelle quelques-uns des formats que l’administration doit privilégier : ODS (OpenOffice) et XLS (Excel) pour les tableaux, RTF et TXT pour les textes, XML pour les données structurées, GML et KML (utilisé par Google Maps notamment) pour les données géographiques, RDF pour les fichiers sémantiques, iCalendar pour les calendriers.Le choix du format est crucial, car il conditionne la facilité à manipuler les données. “ Pour créer nosdéputés.fr, l’essentiel de notre temps a dû être consacré à la récupération des données. Les informations publiées sur le site de l’Assemblée nationale ne sont pas prévues pour être réexploitées ”, témoigne Gabriel Kerneis, de l’association Regards citoyens. François Bancilhon, cofondateur de Data-publica.org, un annuaire des données publiques françaises, abonde dans le même sens : “ Le cauchemar, pour nous, c’est un tableau Excel copié dans une présentation PowerPoint ou un document Word, lequel est ensuite converti en PDF. ” Une étude conjointe de Data Publica et de l’Inria permet d’évaluer l’ampleur du travail. Elle estime que plus de 6,2 millions de fichiers numériques sont actuellement disponibles sur les divers sites Internet de l’Autorité publique (Gouvernement, organismes publics, sociétés d’Etat, régions, préfectures, municipalités…).

Un accès aux données libre et gratuit

Le format PDF est le plus répandu (89 % des fichiers en ligne), suivi par le XLS d’Excel et l’ODT d’OpenOffice. “ Le format ne doit pas être un prétexte, prévient Gabriel Kerneis. Le plus important est de rendre les données publiques disponibles, le format n’est qu’une deuxième étape. ”Autre sujet de débat, les licences qui régissent l’accès aux données publiques et leur utilisation. Par essence, les données doivent être libres et gratuites : les licences doivent prévoir “ le libre accès, la libre reproduction, redistribution, modification, et la libre réutilisation (y compris à des fins commerciales) des données ”, comme le rappelle la déclaration signée par plusieurs acteurs français de l’Open data, selon des principes hérités du logiciel libre. Le consensus sur le sujet est plutôt large car toute tentative de faire payer l’accès et la réutilisation des données serait un frein préjudiciable au développement de nouveaux services.Un exemple : l’Etat possède une base de données des tarifs des carburants dans la totalité des stations-service du pays. Actuellement, il faut payer 35 800 euros par an pour l’utiliser et développer un service commercial. La rendre gratuite, comme l’a souligné Eric Besson en juillet, permettrait “ de développer des services informant les automobilistes des prix dans les stations les plus proches. ” Pour Regards citoyens, signataire de la déclaration, il n’y a pas d’ambiguïté : “ La seule restriction que nous admettons, c’est l’obligation, pour celui qui utilise les données publiques, de diffuser le résultat de son travail et de permettre sa réutilisation à son tour ”, confirme Gabriel Kerneis. C’est le choix qu’a fait la ville de Paris. Par exemple, si un fabricant de GPS se sert des données publiques concernant les places de parking pour les handicapés, les croise avec d’autres informations ou les met en forme, il doit alors rendre disponible, dans les mêmes conditions, le résultat de son travail.

Où peut bien mener ce grand chantier ?

Chaque Etat, chaque ville a tendance à rédiger sa propre licence, s’appuyant plus ou moins sur celle préconisée par l’Open Knowledge Foundation. La mission Etalab, responsable du site data.gouv.fr devrait avoir publié la sienne au moment où ce numéro de Micro Hebdo sera en kiosque, dans l’attente des premières publications de données en décembre. Le mouvement est donc lancé. Il semble irrésistible, irrépressible. Tout juste à son commencement, jusqu’où ira-t-il ? Difficile de se prononcer.Hormis quelques applications devenues des classiques du genre, on a du mal encore à deviner à quoi cette libération des données servira. Mais après tout, quand les services de la ville de Rennes ont mis en ligne un fichier consignant la hauteur des trottoirs, ils n’avaient aucune idée de ce à quoi il pourrait servir. Tout reste donc à inventer.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Olivier Lapirot