République
Française
Published the November 5, 2024
Comment mesurer l’impact des données ouvertes ?
Dans le cadre de ses missions, l’équipe de data.gouv.fr mène des travaux sur la mesure de l’impact de l’open data.
Ces travaux poursuivent un double objectif :
Après avoir passé en revue nos observations sur les impacts gouvernementaux, sociaux, environnementaux et économiques de l’open data, notre série d’articles s’achève aujourd’hui avec un petit guide pratique à l’intention des producteurs de données, qui synthétise les outils et les bonnes pratiques pour suivre l’impact de leurs données.
Pour les producteurs de données, une analyse des usages permet de développer une offre de données ouvertes plus pertinente, davantage adaptée à la demande. Deux mécanismes peuvent être à l’œuvre :
L’observation des utilisations faites et la remontée des besoins des réutilisateurs favorise tout d’abord l’amélioration de la qualité des données. En effet, pour une donnée, la notion de qualité (format, structure, contenu, mise à jour, métadonnées, documentation, etc.) dépend grandement de l’usage qui en est fait. La qualité proposée, bien qu’adaptée aux utilisations internes à l’administration, peut être améliorée pour les usages nouveaux engendrés par l’ouverture. Cette observation est partagée par les producteurs de la Base Sirene qui ont indiqué : « nous faisons parfois des choses qui ont du sens pour nous d’un point de vue gestion, mais dont l’utilisation n’est pas optimale ». Pôle Emploi travaille ainsi étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.
La compréhension des usages permet de motiver la poursuite et le renforcement des efforts de mise à disposition. Les producteurs de données découvrent la valeur de leur travail de publication : les fichiers de gestion de l’administration qu’ils ouvrent deviennent un véritable matériel pour construire des services, des visualisations, des articles journalistiques, etc. Les producteurs de la Base Sirene des entreprises ont expliqué : « s’il y a des réutilisations qui demandent des téléchargements réguliers, nous pouvons anticiper les conséquences de ce type d’utilisation ».
A un niveau plus stratégique, les producteurs de données peuvent aussi mobiliser cette connaissance sur les usages pour faire du reporting auprès de leur hiérarchie, démontrer le retour sur investissement des efforts déployés et ainsi justifier la poursuite du travail engagé. Les producteurs de la Base Sirene des entreprises ont précisé valoriser en interne la forte consommation des données, à l’aide d’un bilan mensuel qui reprend le nombre de requêtes et les principaux réutilisateurs.
Les administrations combinent approches quantitatives et qualitatives pour cerner les usages de leurs données ouvertes.
La plupart mesurent les volumes d’usage, en suivant les métriques des jeux de données publiés proposées par data.gouv.fr ou sur leur propre portail : nombre de téléchargements, nombre de réutilisations, etc.
Exemple des statistiques de l’organisation “Ministère de l’intérieur” au 5 novembre 2024.
Pour préciser cette analyse, certains producteurs engagent également un dialogue avec les réutilisateurs et investiguent la nature des réutilisations. Selon le niveau de maturité et les moyens disponibles, plusieurs leviers sont mobilisés :
Il s’agit d’un canal d’échange privilégié pour les producteurs du Répertoire national des associations, qui compte 412 discussions sur data.gouv.fr.
La Base adresse nationale recense notamment 78 réutilisations référencées sur la plateforme.
Les producteurs de la Base Sirene ont sondé leurs réutilisateurs en 2022 sur des questions de contenu, de format ou encore de documentation des données mais également sur leur identité.
L’Institut National de l’Information Géographique et Forestière (IGN) organise un certain nombre d’événements mettant à l’honneur les réutilisateurs. Il propose également des conférences, des webinaires de prise en main des différents services ainsi que des tutoriels d’accompagnement.
Pour structurer sa démarche de suivi, il est possible de s’appuyer sur le cadre méthodologique proposé par l’équipe de data.gouv.fr.
Nos observations abondent vers une conclusion : les producteurs de données demeurent les meilleurs ambassadeurs des usages de leurs données ouvertes et les plus à même de suivre ces usages. Il apparaît donc essentiel pour l’équipe de data.gouv.fr de les autonomiser sur ce suivi, en leur proposant davantage d’outils et de bonnes pratiques.
Parmi les pistes de travail futures retenues, figurent notamment :
Aperçu de forum.data.gouv.fr
Ces axes s’inscrivent dans la mission de l’équipe de data.gouv.fr, qui est de favoriser la réutilisation des données publiques. Cette mission se décline en objectifs que nous suivons grâce à nos propres indicateurs d’impact :
1. Améliorer la découvrabilité des données ouvertes
Indicateur : pourcentage des utilisateurs ayant répondu positivement à la question "Avez-vous trouvé ce que vous cherchiez ?"
2. Favoriser la qualité des données ouvertes
Indicateur : score de qualité moyen des 1000 jeux de données les plus vues de la plateforme.
3. Encourager la réutilisation des données ouvertes
Indicateur : délai moyen pour une réponse "légitime" aux discussions relatives aux jeux de données (légitime : réponse par un membre de l'organisation qui publie le jeu de données ou par un membre de l'équipe data.gouv.fr.)
4. Faciliter l'accès à l'information
Indicateur : nombre de jeux de données du top 100 associés à une réutilisation "de qualité" (les réutilisations de qualité sont un choix éditorial de l'équipe data.gouv.fr.)
Producteurs de données, vous souhaitez en savoir plus ou avez d’autres demandes concernant le suivi des usages et la valorisation de vos données ouvertes ? L’équipe de data.gouv.fr vous proposera prochainement un webinaire sur la mesure de l’impact des données ouvertes, où elle vous présentera l’essentiel de ce qu’il faut savoir et répondra à toutes vos questions. Nous vous tenons au courant sur la tenue de cet événement, où nous espérons vous voir nombreuses et nombreux !