Impact des données ouvertes 6/6
Published on November 5, 2024
Comment mesurer l’impact des données ouvertes ?
Dans le cadre de ses missions, l’équipe de data.gouv.fr mène des travaux sur la mesure de l’impact de l’open data.
Ces travaux poursuivent un double objectif :
- Quantifier et qualifier les retombées issues des données ouvertes et de la politique d’ouverture des données ;
- Consolider un cadre méthodologique partagé et des outils pour aider les producteurs de données à évaluer l’impact de leurs données.
Après avoir passé en revue nos observations sur les impacts gouvernementaux, sociaux, environnementaux et économiques de l’open data, notre série d’articles s’achève aujourd’hui avec un petit guide pratique à l’intention des producteurs de données, qui synthétise les outils et les bonnes pratiques pour suivre l’impact de leurs données.
Pourquoi connaître l’usage de ses données ?
Pour les producteurs de données, une analyse des usages permet de développer une offre de données ouvertes plus pertinente, davantage adaptée à la demande. Deux mécanismes peuvent être à l’œuvre :
Améliorer la qualité des données
L’observation des utilisations faites et la remontée des besoins des réutilisateurs favorise tout d’abord l’amélioration de la qualité des données. En effet, pour une donnée, la notion de qualité (format, structure, contenu, mise à jour, métadonnées, documentation, etc.) dépend grandement de l’usage qui en est fait. La qualité proposée, bien qu’adaptée aux utilisations internes à l’administration, peut être améliorée pour les usages nouveaux engendrés par l’ouverture. Cette observation est partagée par les producteurs de la Base Sirene qui ont indiqué : « nous faisons parfois des choses qui ont du sens pour nous d’un point de vue gestion, mais dont l’utilisation n’est pas optimale ». Pôle Emploi travaille ainsi étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.
Motiver la poursuite des efforts d’ouverture
La compréhension des usages permet de motiver la poursuite et le renforcement des efforts de mise à disposition. Les producteurs de données découvrent la valeur de leur travail de publication : les fichiers de gestion de l’administration qu’ils ouvrent deviennent un véritable matériel pour construire des services, des visualisations, des articles journalistiques, etc. Les producteurs de la Base Sirene des entreprises ont expliqué : « s’il y a des réutilisations qui demandent des téléchargements réguliers, nous pouvons anticiper les conséquences de ce type d’utilisation ».
A un niveau plus stratégique, les producteurs de données peuvent aussi mobiliser cette connaissance sur les usages pour faire du reporting auprès de leur hiérarchie, démontrer le retour sur investissement des efforts déployés et ainsi justifier la poursuite du travail engagé. Les producteurs de la Base Sirene des entreprises ont précisé valoriser en interne la forte consommation des données, à l’aide d’un bilan mensuel qui reprend le nombre de requêtes et les principaux réutilisateurs.
Comment suivre les usages de ses données ouvertes ?
Les administrations combinent approches quantitatives et qualitatives pour cerner les usages de leurs données ouvertes.
La plupart mesurent les volumes d’usage, en suivant les métriques des jeux de données publiés proposées par data.gouv.fr ou sur leur propre portail : nombre de téléchargements, nombre de réutilisations, etc.
Exemple des statistiques de l’organisation “Ministère de l’intérieur” au 5 novembre 2024.
Pour préciser cette analyse, certains producteurs engagent également un dialogue avec les réutilisateurs et investiguent la nature des réutilisations. Selon le niveau de maturité et les moyens disponibles, plusieurs leviers sont mobilisés :
- Réponses aux commentaires et aux questions soumis sur data.gouv.fr, notamment sur la qualité des données
Il s’agit d’un canal d’échange privilégié pour les producteurs du Répertoire national des associations, qui compte 412 discussions sur data.gouv.fr.
- Suivi des réutilisations ajoutées sur data.gouv.fr et incitation au référencement
La Base adresse nationale recense notamment 78 réutilisations référencées sur la plateforme.
- Enquêtes auprès des réutilisateurs
Les producteurs de la Base Sirene ont sondé leurs réutilisateurs en 2022 sur des questions de contenu, de format ou encore de documentation des données mais également sur leur identité.
- Animation de communautés de réutilisateurs
L’Institut National de l’Information Géographique et Forestière (IGN) organise un certain nombre d’événements mettant à l’honneur les réutilisateurs. Il propose également des conférences, des webinaires de prise en main des différents services ainsi que des tutoriels d’accompagnement.
- Entretiens avec les principaux réutilisateurs.
Pour structurer sa démarche de suivi, il est possible de s’appuyer sur le cadre méthodologique proposé par l’équipe de data.gouv.fr.
Quelles perspectives de travail pour l’équipe de data.gouv.fr ?
Nos observations abondent vers une conclusion : les producteurs de données demeurent les meilleurs ambassadeurs des usages de leurs données ouvertes et les plus à même de suivre ces usages. Il apparaît donc essentiel pour l’équipe de data.gouv.fr de les autonomiser sur ce suivi, en leur proposant davantage d’outils et de bonnes pratiques.
Parmi les pistes de travail futures retenues, figurent notamment :
- Sensibiliser les producteurs de données à l’intérêt de connaître les usages en explicitant comment cette connaissance peut être mobilisée (démarche amorcée avec un catalogue partagé de cas d’usage de l’open data) ;
- Partager les leviers méthodologiques et techniques ainsi que les bonnes pratiques pour suivre les usages ;
- Echanger avec les producteurs de données matures sur le sujet, pour collecter davantage de bonnes pratiques ;
- Proposer un accompagnement sur l’animation de communauté de réutilisateurs ;
- Développer des outils pratiques pour mesurer les usages, et notamment travailler sur certaines améliorations produit de la plateforme data.gouv.fr ;
- Favoriser les échanges entre producteurs et réutilisateurs de données (démarche poursuivie avec le lancement de forum.data.gouv.fr) ;
- Mettre à disposition une offre de service sur la valorisation des données.
Aperçu de forum.data.gouv.fr
Ces axes s’inscrivent dans la mission de l’équipe de data.gouv.fr, qui est de favoriser la réutilisation des données publiques. Cette mission se décline en objectifs que nous suivons grâce à nos propres indicateurs d’impact :
1. Améliorer la découvrabilité des données ouvertes
Indicateur : pourcentage des utilisateurs ayant répondu positivement à la question "Avez-vous trouvé ce que vous cherchiez ?"
2. Favoriser la qualité des données ouvertes
Indicateur : score de qualité moyen des 1000 jeux de données les plus vues de la plateforme.
3. Encourager la réutilisation des données ouvertes
Indicateur : délai moyen pour une réponse "légitime" aux discussions relatives aux jeux de données (légitime : réponse par un membre de l'organisation qui publie le jeu de données ou par un membre de l'équipe data.gouv.fr.)
4. Faciliter l'accès à l'information
Indicateur : nombre de jeux de données du top 100 associés à une réutilisation "de qualité" (les réutilisations de qualité sont un choix éditorial de l'équipe data.gouv.fr.)
Producteurs de données, vous souhaitez en savoir plus ou avez d’autres demandes concernant le suivi des usages et la valorisation de vos données ouvertes ? L’équipe de data.gouv.fr vous proposera prochainement un webinaire sur la mesure de l’impact des données ouvertes, où elle vous présentera l’essentiel de ce qu’il faut savoir et répondra à toutes vos questions. Nous vous tenons au courant sur la tenue de cet événement, où nous espérons vous voir nombreuses et nombreux !