Impact des données ouvertes 1/6

« L’objectif premier de la mise à disposition des données publiques et de la promotion de leur réutilisation est d’en tirer un impact économique, environnemental et sociétal. » (Open Data Maturity Report 2023).

Les impacts de l’ouverture des données publiques ont été largement discutés et justifient la mise en œuvre d’une politique ambitieuse en la matière. Ainsi, en France, ministères, opérateurs de l’Etat, agences nationales ou encore collectivités territoriales se mobilisent pour publier leurs données.

Pourtant, plus de dix ans après les premiers mouvements d’ouverture, les mesures de l’impact de l’open data restent ponctuelles et les retombées réelles de cette politique doivent encore être davantage décrites et analysées.

Dans le cadre de ses missions, l’équipe de data.gouv.fr a entrepris de contribuer à ces réflexions et de mener des travaux sur la mesure de l’impact de l’open data. Ces travaux viennent enrichir d’autres études existantes, à l’instar du projet DataImpact d’OpenDataFrance.

Dans une série d’articles, qui démarre aujourd’hui, nous vous présentons les observations et enseignements collectés au cours de ces travaux :

1 Comment définir l’impact des données ouvertes ?
2 Quel est l’impact des données ouvertes sur l’action publique ?
3 Quel est l’impact des données ouvertes sur l’environnement ?
4 Quel est l’impact social des données ouvertes ?
5 Quel est l’impact économique des données ouvertes ?
6 Comment mesurer l’impact des données ouvertes ?

Ce premier billet pose le cadre théorique et méthodologique de notre démarche d’évaluation.

Comment définir l’impact de l’open data ?

Les données ouvertes génèrent de la valeur dès lors que des citoyens, des chercheurs, des agents publics, des entreprises, etc. s’en saisissent et les réutilisent pour créer de nouveaux usages ou enrichir des services existants.

Il n’existe aujourd’hui pas de définition commune de l’impact de l’open data à l’échelle nationale, européenne ou mondiale. Une revue de littérature révèle néanmoins deux définitions dominantes : celles établies par l’Open Data Maturity report (ODM) et l’Open Data Barometer (ODB).

L’Open Data Maturity report (ODM) définit quatre catégories d’impact de l’open data :

Impact social : impact sur les défis sociaux, tels que l’inclusion des groupes marginalisés dans la société, les problématiques de logement dans les zones urbaines ou encore les questions liées à la santé et au bien-être ;
Impact gouvernemental : retombées en termes d’amélioration des services publics, de l’efficacité de l’action publique et de la transparence de la vie publique ;
Impact économique ;
Impact environnemental : effets dans des domaines comme la qualité de l’air et de l’eau, les systèmes de gestion des déchets et de transport, etc.

L’Open Data Barometer (ODB), quant à lui, distingue trois catégories d’impact :

Impact social : impact sur l’environnement et l’inclusion des groupes marginalisés dans l’élaboration de politiques publiques ;
Impact politique : effets sur l’efficacité, la transparence et la responsabilité des gouvernements ;
Impact économique : retombées économiques et sur la création d’entreprises.

Ces catégories sont largement utilisées par les pays pour décrire l’impact de leur politique d’ouverture des données, même s’il existe des différences dans ce qu’elles recoupent pour chacun. En France, la proposition du rapport Bothorel « Pour une politique publique de la donnée, des algorithmes et des codes sources » s’inscrit dans ce cadre :

« pour les citoyens, un enjeu de transparence de la vie publique et de simplification des démarches » ;
« pour les entreprises, susciter l’innovation et moderniser l’économie » ;
« pour les acteurs publics, éclairer la décision et améliorer la qualité des services publics » ;
« pour la recherche, fertiliser l’activité et favoriser les collaborations ».

Comment mesurer l’impact des données ouvertes ?

Mesurer l’impact de l’open data est un exercice complexe, des difficultés pouvant survenir dans la définition des indicateurs à suivre et l’obtention des données de mesure.

En complément à l’approche thématique (social, gouvernemental, économique, environnemental) présentée ci-dessus, l’équipe de data.gouv.fr propose une méthodologie d’analyse par niveau. Elle repose sur l’examen de quatre niveaux pour lesquels l’usage des données est estimé :

Les données brutes elles-mêmes : visites sur les pages de jeux de données, les téléchargements, etc. ;
Les utilisations directes des données : nombre et nature des réutilisations sur les jeux de données ;
Les utilisations indirectes des données : usage des réutilisations ;
Les externalités : impacts sociaux et économiques à plus grande échelle.

Nous mesurons :

Les niveaux 1 et 2, à partir des métriques de la plateforme data.gouv.fr ;

Les niveaux 3 et 4 en identifiant et mesurant l’impact de cas d’usage de données ouvertes.

Pour ce deuxième volet, les cas d’usage examinés ont été sélectionnés à partir de trois sources principales :

Le catalogue de réutilisations de la plateforme data.gouv.fr ;
Le catalogue de services publics numériques développés au sein de beta.gouv.fr ;
Le catalogue de publications de recherche sur scanr.

Et selon trois critères :

Un impact potentiel élevé ;
La disponibilité de ressources et d’informations ;
Une répartition équilibrée dans les quatre catégories d’impact définies par l’Open Data Maturity Report.

Pour chaque cas d’usage, une recherche documentaire a été réalisée et des entretiens parfois menés avec leurs concepteurs pour documenter les services, les données utilisées et les impacts créés.

Cette méthodologie, bien que présentant des limites, permet de cerner l’impact des données ouvertes et a été appliquée dans notre récente étude.

Notre approche rejoint les travaux actuellement menés par data.europa.eu pour concevoir un cadre méthodologique partagé pour évaluer l’impact de l’open data, notamment :

The Use Case Observatory : un projet de recherche qui suit 30 cas d’usage de données ouvertes sur une période de trois ans, pour mettre en évidence l’impact économique, gouvernemental, social et environnemental de l’open data ;
Indicators for an open data impact assessment : une étude qui propose d’analyser les outputs (résultats directs de la mise à disposition des données ouvertes), les outcomes (effets à court et moyen terme) et les impacts (effet général à long terme) tout au long de la chaîne de valeur de la donnée (collecte, publication, usage, application) pour évaluer les effets de l’open data. Une liste d’indicateurs pour quantifier les outputs y est proposée. Pour les outcomes et les impacts, il y est recommandé de définir des indicateurs spécifiques plus étroitement liés aux cas d’usage.

Chaque semaine, et pendant tout le mois d’octobre, nous vous présentons le contenu de notre étude, avec successivement un aperçu de l’impact de l’open data sur :

l’action publique ;
la société ;
l’économie ;
l’environnement.

A la semaine prochaine !