Exploration de données : zoom sur de nouvelles briques disponibles sur data.gouv.fr avec l’exemple du prix des carburants
Publié le 27 octobre 2022
Découvrez le potentiel des données pour le pilotage des politiques publiques, le service aux usagers et l’information du public !
Les données ouvertes constituent un puissant vecteur d’information pour le grand public. A l’instar du tableau de bord de suivi de l’épidémie du Covid-19 initialement développé par Etalab et publié sur gouvernement.fr, elles permettent notamment de renseigner les citoyennes et les citoyens en temps de crise.
Nous disposons de nombreuses briques techniques ouvertes, mutualisables et réutilisables qu’il est possible de mobiliser pour proposer des visualisations de données sur une diversité de thématiques comme le logement, l’aménagement du territoire, l’éducation ou encore l’énergie.
En guise de démonstration, nous les avons appliquées à un exemple d’actualité en les utilisant sur les données des prix des carburants. En plus des nouvelles fonctionnalités d’exploration des données, nous proposons une application simple permettant de suivre l’évolution des ruptures et des prix sur l’ensemble du territoire.
Le développement de cette visualisation est rendu possible grâce aux données relatives aux prix des carburants, mises à disposition par le ministère de l’économie, des finances et de la souveraineté industrielle et numérique et des tuiles vectorielles (openmaptiles).
Cette cartographie repose également sur l’exploitation des données de référence du Service public de la donnée et des API associées (API de la Base Adresse Nationale). La méthodologie employée est détaillée à la fin de cet article.
A l’instar de l’application Demandes de Valeur Foncières (DVF) ou de l’Annuaire des Entreprises, ce service vient compléter les quelques applications développées en propre par les équipes d’Etalab et illustre le potentiel des données pour le pilotage des politiques publiques, le service aux usagers et l’information du public.
Elles s’ajoutent bien sûr à toutes les réutilisations des données ouvertes réalisées par la communauté !
⇒ Vous avez aussi exploité et/ou analysé les données sur les prix des carburants ? Partagez vos travaux sur data.gouv.fr pour permettre d’informer le plus grand nombre !
Méthodologie
La visualisation est réalisée à partir des jeux de données ouverts “Prix des carburants” du ministère de l'économie, des finances et de la souveraineté industrielle et numérique.
Ce jeu de données est composé de plusieurs ressources utiles pour l'élaboration du tableau de bord.
D'abord, le fichier Flux instantané, mis à jour toutes les dix minutes, est utile pour récupérer l'ensemble des prix des carburants, par station-service, avec la date de remontée des prix la plus récente. Attention, si le flux de données est mis à jour toutes les dix minutes, cela n’implique pas que toutes les stations mettent à jour leur prix toutes les dix minutes. C'est pourquoi nous indiquons dans le tableau de bord, pour chacun des prix, la dernière date de remontée de la donnée.
L’ensemble des prix courants d’un carburant est alors scindé en trois tiers (tertiles) et nous attribuons une couleur à chacun de ces tiers pour une meilleure visibilité utilisateur. Le premier tiers regroupe les prix les moins chers (en vert dans le tableau de bord), le deuxième tiers regroupe les prix moyennement chers (en marron dans le tableau de bord) et le troisième tiers regroupe les prix les plus chers (en orange dans le tableau de bord).
Ensuite, le fichier Flux quotidien nous permet de déduire les carburants en rupture dans une station. En effet, l’information sur la rupture n’étant pas présente dans le flux instantané, nous récupérons cette dernière dans le flux quotidien. Pour faire la distinction entre un carburant en rupture et un carburant non proposé par une station, nous avons mis en place une règle de gestion spécifique permettant de distinguer les stations dont un carburant est en rupture depuis le 15 septembre. Si la rupture est constatée avant cette date, cela semble indiquer que la rupture n’est pas lié à la pénurie actuelle et nous indiquons donc le carburant comme non proposé dans la station. Si cette rupture est constatée après la date du 15 septembre, celle-ci est probablement due à la pénurie en cours et nous indiquons donc le carburant en rupture dans la station.
Enfin, pour afficher l’évolution des prix moyens d’un carburant depuis le début de l’année, nous exploitons le fichier Flux annuel qui nous permet de récupérer l’ensemble des prix des carburants de toutes les journées de l’année en cours. Nous effectuons donc une moyenne sur l’ensemble des prix des stations proposant un carburant particulier pour chaque journée, ce qui nous permet de tracer le graphique présent dans le tableau de bord.