République
Française
Published the October 22, 2024
Quel est l'impact social des données ouvertes ?
Dans le cadre de ses missions, l’équipe de data.gouv.fr mène des travaux sur la mesure de l’impact de l’open data.
Nous avons récemment réalisé une étude pour documenter et analyser cet impact, selon les quatre dimensions identifiées par l’Open Data Maturity report (ODM) :
Cette série d’articles présente l’impact des données ouvertes dans chacun de ces domaines. Après avoir abordé l’impact gouvernemental et environnemental, nous nous consacrons aujourd’hui à l’impact social des données ouvertes.
Les données ouvertes peuvent contribuer à répondre à des questions sociales telles que :
C’est ce que l’on entend par impact social de l’open data.
Parmi les données les plus emblématiques de la thématique figurent notamment :
Dans le cadre de nos travaux, les quatre aspects susmentionnés ont été mesurés en examinant :
Les résultats directs induits par les données ouvertes couvrent :
Ces deux volets sont mesurés au moyen d’indicateurs comme le nombre de vues sur les jeux de données de la thématique, le nombre de téléchargements, le nombre de réutilisations, etc. et quantifiés à partir des métriques de la plateforme data.gouv.fr.
La catégorie “Questions sociales” englobe 6487 jeux de données sur data.gouv.fr, comptabilisant au total 23,5 millions de vues et plus de 156,7 millions de téléchargements (statistiques pour la période été 2023-été 2024).
Ces jeux de données font l’objet de nombreuses interactions, avec 2804 discussions recensées sur la même période. En 2023, 405 nouveaux jeux de données se rapportant à cette catégorie ont été publiés, indiquant un flux constant de mises à jour et de nouvelles données mises à disposition du public.
A ce jour, 1222 réutilisations ont été référencées sur data.gouv.fr comme se rapportant à la catégorie “Questions sociales”, avec 163 nouvelles réutilisations publiées en 2023. Elles ont été consultées près de 4,7 millions de fois pendant la période étudiée.
Note méthodologique : Ces statistiques ont été obtenues à partir d’un travail de thématisation du catalogue de données de la plateforme data.gouv.fr.
Bien que cette catégorisation soit intéressante, il est important de garder en tête les limites de l’exercice lors de l’analyse :
Cette analyse quantitative doit ainsi nécessairement être complétée d’une étude qualitative.
La connaissance des effets à moyen et long terme des données ouvertes passe par l’examen minutieux de cas d’usage pour en comprendre les services proposés, les données utilisées et en révéler les impacts.
Les exemples d’usage examinés dans notre étude permettent de rendre compte de ces effets sur la société. Il s’agit ici de vous permettre de les apprécier en les présentant succinctement.
Nous nous sommes intéressés à deux cas d’usage qui convergent vers une mise en évidence d’inégalités existantes :
Proposé par le ministère de la culture, l’Atlas Culture des territoires permet de comprendre les dynamiques culturelles. Il mobilise des données publiques relatives à l’offre culturelle, aux dépenses culturelles, à l’emploi et aux entreprises culturelles, ainsi que des indicateurs socio-économiques, pour proposer :
Cette cartographie concourt à l’identification des inégalités culturelles et à l’adaptation des stratégies d’aménagement culturel. L’Atlas permet également au grand public de comprendre les enjeux liés aux politiques culturelles et de participer au débat public.
Cette analyse des données ouvertes relatives aux célébrations et commémorations permet de visualiser les périodes historiques concernées, les thématiques commémorées, etc. mais surtout de révéler de nombreuses inégalités de représentation : depuis 1970, seules 103 femmes ont été célébrées, sur 1358 individus (7,5%).
Nombre de célébrations par genre au fil des années
Deux cas d’usage illustrent la façon dont les données ouvertes peuvent être mobilisées pour résoudre des problématiques relatives au logement urbain :
Résorption bidonvilles est un service public numérique qui permet aux services de l’Etat, collectivités territoriales, etc. de connaître, partager et agir pour résorber les bidonvilles. Il permet notamment :
Par un suivi opérationnel simplifié pour les responsables publics et une meilleure coordination entre acteurs, l’outil favorise l’accélération de la résorption des bidonvilles et un meilleur accompagnement des populations. Depuis le lancement de la plateforme en 2019, plus de 4000 personnes ont été relogées (17 sites résorbés en 2022, 28 en 2021, 16 en 2020) et en 2022 :
Aux Alentours par MAIF est un outil développé par la société d’assurance mutuelle. Il agrège et cartographie de nombreuses données ouvertes (risques, équipements, arrêts de transport, exposition au bruit, etc.) pour permettre à chacune et chacun de mieux connaître les risques associés à son environnement et d’en prévenir les conséquences avec des conseils adaptés.
Sur la santé et le bien-être, nous nous sommes attardés sur 2 usages :
L’association Euros for Docs s’est donné pour objectif de simplifier l’accès à la base Transparence Santé, dans laquelle les industriels déclarent tous leurs liens d’intérêt, en nettoyant les données et en offrant une interface simplifiée. Les usages sont nombreux :
Les données de rapportage de la saison balnéaire et des données publiques météorologiques sont mobilisées pour nourrir un modèle de type machine learning qui estime le risque de contamination bactériologique fécale (jusqu’à une échéance de 5 jours, avec 4 niveaux d’alerte). L’outil permet aux collectivités de mieux gérer leurs sites de baignade et au grand public d’exercer un principe de précaution.
Les exemples abondent concernant l’usage des données ouvertes dans le domaine de l’éducation et des compétences. Nous en avons retenu 4 pour être examinés :
DiagOriente est un service public numérique qui permet aux jeunes de formaliser leurs compétences et intérêts professionnels, de découvrir les métiers correspondants et de trouver des formations et/ou des emplois plus facilement. Il s’appuie notamment sur le répertoire opérationnel des métiers et des emplois, les données du marché du travail ou encore les données sur les offres d'emploi. Le service compte aujourd’hui plus de 400 000 utilisateurs, parmi lesquels :
Projet personnel de deux citoyens, SupTracker met en forme les données ouvertes relatives à Parcoursup pour permettre de :
Grâce à l’application, les élèves peuvent mieux s’informer sur les formations qu’ils envisagent d’intégrer (recrutement et sélectivité) pour formuler des projets d’orientation cohérents.
L’indice de position sociale d’un établissement est un indicateur qui résume les conditions socio-économiques et culturelles des familles des élèves qu’il accueille. Les données associées, publiées en 2022 par le ministère de l’éducation nationale, ont permis de relancer et nourrir le débat sur le manque de brassage social dans les établissements scolaires, par exemple :
Dans le cadre de l’Open Data University, les données ouvertes deviennent un outil de formation, au service du développement des compétences et de l’engagement citoyen. L’Open Data University est un dispositif qui propose aux établissements de l’enseignement supérieur de faire travailler leurs élèves sur des challenges open data qui répondent à des enjeux sociaux et environnementaux. Le programme est porté par l’association Latitudes, qui travaille aux côtés de 100 établissements du supérieur pour intégrer une dimension sociale et environnementale à leur cursus. En 2023-2024, ce sont plus de 650 étudiants, issus de 16 établissements, qui se sont formés en travaillant sur des défis open data sur les données des élections, de la culture ou encore de l’énergie. La saison 3 est lancée : responsables pédagogiques et enseignants, n’hésitez pas à la rejoindre !
Nous vous donnons rendez-vous la semaine prochaine pour découvrir ensemble l’impact économique de l’open data !