Base Étendue, Améliorée et Unifiée des Annonces des Marchés Publics BeauAMP

Description

Le jeu de données fusionne les informations contenues au Bulletin Officiel des Annonces des Marchés Publics (BOAMP) avec les données de la base SIRENE de l'INSEE pour l'ensemble des marchés publics attribués de 2015 à 2023.

Principaux apports :

  • Conversion des données textuelles des avis publiés au BOAMP en un format tabulaire
  • Catégorisation des critères de sélection et harmonisation de leur pondération
  • Estimation des SIRET des acheteurs et des titulaires
  • Géolocalisation des acheteurs et des titulaires (y compris à l'étranger)
  • Importation de nombreuses informations sur les entreprises et les acheteurs mentionnés au BOAMP

Format des données :

Les données se présentent sous la forme d'un tableau où chaque ligne représente une relation contractuelle entre l'acheteur et le titulaire (ou annonce l'infructuosité/la décision de ne pas donner suite le cas échéant), et chaque colonne décrit une caractéristique du marché, du résultat de la procédure d'attribution, de l'acheteur ou du titulaire. Au total, plus de 350 000 marchés publics sont ainsi décrits, liant 16 000 acheteurs et 130 000 titulaires dans un tableau de 1 162 969 lignes et 114 colonnes.

Fichiers disponibles :

  • beauamp1.1.0.csv : fichier global couvrant les données de janvier 2015 à décembre 2023
  • 20xx_beauamp1.1.0.csv : neuf fichiers annuels (marchés attribués du 1er janvier au 31 décembre de l'année 20xx)
  • definition-des-variables.pdf : explication des variables présentes dans la base
  • structure-des-donnees.png : un schéma résumant la structure du jeu de données
  • constitution-des-donnees.png : un schéma retraçant les différentes étapes de la constitution des données

Pour davantage de détails sur l'origine des données : Lien vers le Github

Pour davantage de détails sur l'IA utilisée pour estimer les SIRET : Rapport technique

Pour utiliser le format Pickle (recommandé) : Jeu de données sur Zenodo

Contact :

For academic research purpose :
Please use and cite the data on this repository.
Deschamps, A., & Potin, L. (2024). BeauAMP : processing and consolidation of open data on public procurement in France (2015-2023) [Data set]. Zenodo. https://zenodo.org/records/11001277
[data paper being peer-reviewed]

Origine du projet :

Le projet a été en partie financé par l'Agence Nationale de la Recherche :
Détecter la Corruption dans les Marchés Publics - Grant ANR-19-CE38-0004

Il s'inscrit dans le cadre d'un travail doctoral :
Évaluation de la politique de l'achat vert dans les marchés publics en France, Adrien Deschamps, Avignon Université, Laboratoire ⸱JPEG, sous la direction de Pierre-Henri Morand et de Cyrille Genre-Grandpierre.

Mise en garde :
Les données de la base n'ont qu'une valeur indicative, facilitant la réalisation de travaux d'évaluation. A l'échelle d'un marché, des approximations ou des erreurs ont pu apparaître dans le traitement des annonces et dans l'estimation des SIRET. Les données ne sauraient avoir la même valeur que les avis publiés initialement au BOAMP. En cas de doute, consulter les avis publiés au BOAMP et les documents de marché.

Author

This dataset has been published on the initiative and under the responsibility of Adrien Deschamps.

Latest update

May 7, 2024

License

Creative Commons Attribution Share-Alike

Metadata quality
100.0/100

There are no reuses for this dataset yet.

Publish a reuse What's a reuse ?

There are no discussions for this dataset yet.

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

Temporality

Creation

May 5, 2024

Frequency

Biannual

Temporal coverage

2015 to 2023

Latest update

May 7, 2024

Spatial coverage

Territorial coverage

France

Territorial coverage granularity

Other

Actions

Embed

Statistics for the year

Views

1.4k

121 in Nov 2024

Downloads

470

16 in Nov 2024

Reuses of this dataset

0

Followers

2