Base de connaissances sur les produits phytopharmaceutiques à partir de sources ouvertes (C3PO)

Description


Contexte

De nombreuses substances entrant dans la composition des produits phytopharmaceutiques (PPP) ont un impact démontré sur la santé et l’environnement. Les études s’intéressant à ces impacts peuvent mobiliser plusieurs sources de données de référence gérées par différentes structures et ne reposant pas systématiquement sur des référentiels communs. Différents acteurs travaillant sur le croisement et le rapprochement des données relatives aux PPP ont pu relever la difficulté d'exploiter et de rapprocher ces différentes sources.

Afin de répondre à ce besoin et de faciliter la diffusion des informations publiques relatives aux produits phytopharmaceutiques et aux substances constituant ces derniers, la Base de Connaissances sur les Produits PhytoPharmaceutiques à partir de sources Ouvertes (C3PO) a été initiée par l'Office Français de la Biodiversité, porteur de ce projet dans le cadre du challenge Green Data For Health (https://challenge.gd4h.ecologie.gouv.fr/). Ce travail a été en grande partie réalisé grâce à l'aide des bénévoles qui ont participé au projet C3PO dans le cadre de ce challenge.

Les informations contenues dans C3PO proviennent de diverses sources de données ouvertes de référence. La source de données « pivot » de C3PO est la Banque nationale de ventes par les distributeurs agréés (BNV-D, https://ventes-produits-phytopharmaceutiques.eaufrance.fr/). Cette dernière répertorie depuis 2008 les données d'achats (https://data.ofb.fr/catalogue/data-eaufrance/fre/catalog.search#/metadata/a69c8e76-13e1-4f87-9f9d-1705468b7221) et de ventes (https://data.ofb.fr/catalogue/data-eaufrance/fre/catalog.search#/metadata/bd45f801-45f7-4f8c-b128-a1af3ea2aa3e) des produits phytopharmaceutiques sur le territoire français.

La base de données C3PO s'adresse à tous les acteurs travaillant sur des thématiques liées aux pressions exercées par les substances et produits phytopharmaceutiques (notamment institutions publiques et gouvernementales, organismes de recherche, bureaux d'étude ou encore associations).


Version

La version de la base C3PO actuellement diffusée est la V1.2.


Sources de données mobilisées

La base C3PO diffuse des informations relatives aux substances et produits répertoriés dans la dernière version disponible des données ouvertes de la BNV-D. Des informations issues des dernières versions en vigueur des sources de données suivantes sont ensuite ajoutées à cette liste des substances et produits de la BNV-D :

Les informations issues de ces sources de données sont intégrées dans la base de données C3PO soit de manière "brute" (sans retraitement de leur contenu avant intégration en base) soit après traitements (informations brutes extraites des sources de données puis traitées en vue de l'intégration en base).


Contenu

Le modèle de données de la base C3PO est élaboré suivant une logique par source de données, il se décline en sept schémas :

  • "bnvd", comportant des informations relatives aux substances (années de vente, fonctions, classification RPD) et aux produits (type d’autorisation, - AMM ou PCP -, dont dispose le produit pour sa commercialisation en France, années de ventes, composition en substances, emploi autorisé dans les jardins) répertoriés dans les données ouvertes de la BNV-D ;
  • "agritox", comportant une table de jointure entre substances de Agritox et de la BNV-D, ainsi que des informations relatives à ces substances (propriétés physico-chimiques, toxicité, écotoxicité, catégories et mentions de danger) ;
  • "atp", comportant une table de jointure entre substances du tableau d’entrées harmonisées disponible à l’annexe VI du règlement CLP (ATP) et de la BNV-D , ainsi que des informations relatives à ces substances (identifiants, catégories et mentions de danger) ;
  • "eupdb", comportant une table de jointure entre substances de la base de données de l’Union Européenne sur les pesticides (EU Pesticides Database) et de la BNV-D, ainsi que des informations relatives à ces substances (statut d’autorisation dans les Etats-Membres de l’UE, dates de début et de fin d’approbation, autres indications relevant de la réglementation européenne : substances de base, candidates à substitution ou à faible risque) ;
  • "sandre", comportant une table de jointure entre substances du référentiel « Paramètres » du Sandre et de la BNV-D, ainsi que des informations relatives à ces substances (groupes de paramètres, famille et fonction auxquels elles sont affiliées) ;
  • "ephy", comportant :
    ○ une table de jointure entre substances de E-phy et de la BNV-D, ainsi que des informations relatives à ces substances (variants, état d’autorisation en France) ;
    ○ deux tables de jointure entre produits de E-phy (une pour les AMM et une pour les PCP) et de la BNV-D, ainsi que des informations relatives à ces produits (dénominations et type commerciaux, titulaire de l’AMM, détenteur du PCP, état d’autorisation, composition en substances, usages dont culture autorisées suivant la nomenclature E-phy ainsi que suivant la nomenclature du RPG, mentions de danger et phrases de risque) ;
  • "c3po" : schéma comportant deux tables de métadonnées de la base C3PO

Les tables constituant chacun de ces schémas sont diffusées sur cette page sous forme de fichiers .csv, leur contenu est détaillé dans le fichier "datapaper_C3PO_V2.0.pdf".


Structure des données

Les données sont diffusées dans un fichier .zip (nomenclature : "c3po{numéro de version}{date au format aaaammjj.zip"), comportant plusieurs fichiers .csv (un fichier par table intégrée de chaque schéma de la base de données) qui suivent la nomenclature "{nom du schéma}_{nom de la table}.csv". Les fichiers .csv sont les suivants :

  • "bnvd_substance.csv" : Liste et informations uniques (fonctions, première et dernière années de vente, dernière classification RPD connue) des substances répertoriées dans la BNV-D.
  • "bnvd_ref_classification.csv" : Informations annuelles des classifications et mentions RPD de chaque substance de la BNV-D.
  • "bnvd_substance_classification.csv" : Table de jointure entre bnvd_substance et bnvd_ref_classification.
  • "bnvd_amm.csv" : Liste et informations uniques (première et dernière années de vente, conditionnement) des produits ayant disposé ou disposant d’une AMM et répertoriés dans la BNV-D.
  • "bnvd_amm_evol_composition.csv" : Informations annuelles associées à chaque produit ayant disposé ou disposant d’une AMM et répertorié au moins une fois dans l’historique de ventes de la BNV-D (composition en substances.
  • "bnvd_pcp.csv" : Liste et informations uniques (première et dernière années de vente, conditionnement) des produits ayant disposé ou disposant d’un PCP et répertoriés dans la BNV-D.
  • "bnvd_pcp_evol_composition.csv" : Informations annuelles associées à chaque produit ayant disposé ou disposant d’un PCP et répertorié au moins une fois dans l’historique de ventes de la BNV-D (composition en substances.
  • "sandre_substance_bnvd.csv" : Table de jointure entre substances de la BNV-D et substances du référentiel « Paramètres » du Sandre.
  • "sandre_parametres.csv" : Liste et informations uniques (code sandre, libellé et numéro CAS) des substances du référentiel « Paramètres » du Sandre disposant d’un numéro CAS.
  • "sandre_gpes_parametres.csv" : Liste et informations uniques (code sandre, libellé, famille chimique et fonction) des substances du référentiel « Groupes de Paramètres » pour les paramètres Sandre disposant d’un numéro CAS et affiliées au groupe de paramètres de code Sandre « 95 » (Phytosanitaires).
  • "sandreparametres gpes_parametres.csv" : Table de jointure entre les tables sandre_parametres et sandre_gpes_parametres.
  • "eupdb_substance_bnvd.csv" : Table de jointure entre substances de la BNV-D et substances de la EU PDB.
  • "eupdb_substance.csv" : Liste et informations uniques (statut d’autorisation dans les Etats-Membres de l’UE, dates de début et de fin d’approbation, autres indications relevant de la réglementation européenne : substances de base, candidates à substitution ou à faible risque) des substances de la EU PDB.
  • "agritox_substance_bnvd.csv" : Table de jointure entre substances de la BNV-D et substances de Agritox.
  • "agritox_substance.csv" : Liste et informations uniques (dénomination, identifiants et formule chimique, masse molaire, pureté) des substances de Agritox.
  • "agritox_substance_classement.csv" : Classement (classification, catégories et mentions de danger) des substances de Agritox.
  • "agritox_substance_proprietes_pc.csv" : Propriétés physico-chimiques des substances de Agritox.
  • "agritox_substance_toxicite.csv" : Données de toxicité des substances de Agritox.
  • "agritox_substance_ecotoxicite.csv" : Données d’écotoxicité des substances de Agritox.
  • "agritox_substance_vtr.csv" : Valeurs toxicologiques de référence des substances de Agritox.
  • "atp_substance_bnvd.csv" : Table de jointure entre substances de la BNV-D et substances de l’ATP.
  • "atp_substance.csv" : Liste et informations uniques (dénomination) des substances de l’ATP.
  • "atp_substance_classement.csv" : Classement (classification, catégories et mentions de danger) des substances de l’ATP.
  • "ephy_substance_bnvd.csv" : Table de jointure entre substances de la BNV-D et substances de E-phy.
  • "ephy_substance.csv" : Liste et informations uniques (identifiants, liste de variants, état d’autorisation) des substances de E-phy. Remarque : la liste des noms de variants est stockée dans un même et unique champ, en cas d’existence de plusieurs noms de variants pour une même substance, ils sont séparés par « | ».
  • "ephy_substance_variants.csv" : Détail des variants i.e. des autres noms possibles pour la substance d’après E-phy, un variant par ligne. Remarque : les informations contenues dans cette table ont été obtenues après extraction des modalités de variants séparées par « | » dans le champ ‘variant’ de la table ephy_substance.
  • "ephy_amm_bnvd.csv" : Table de jointure entre produits de la BNV-D et de E-phy disposant d’une AMM.
  • "ephy_pcp_bnvd.csv" : Table de jointure entre produits de la BNV-D et de E-phy disposant d’un PCP.
  • "ephy_amm.csv" : Liste et informations uniques (identifiants, titulaire de l’AMM, type de produit, type commercial, état d’autorisation) des produits de E-phy disposant d’une AMM.
  • "ephy_pcp.csv" : Liste et informations uniques (identifiants, détenteur du PCP, type de produit, type commercial, état d’autorisation) des produits de E-phy disposant d’un PCP.
  • "ephy_pcp_origine.csv" : Informations relatives à l’origine des PCP.
  • "ephy_amm_second_nom.csv" : Seconds noms éventuels des produits de E-phy disposant d’une AMM.
  • "ephy_amm_composition.csv" : Informations relatives à la composition en substances des produits de E-phy disposant d’une AMM.
  • "ephy_amm_usage.csv" : Informations relatives aux usages des produits de E-phy disposant d’une AMM.
  • "ephy_ref_culture_rpg.csv" : Nomenclature des cultures et groupes de cultures du RPG (version 2.1).
  • "ephy_usage_culture.csv" : Table de jointure entre les usages des produits d’après E-phy (ephy_amm_usage.csv) et les cultures suivant la nomenclature du RPG (ephy_ref_culture_rpg.csv).
  • "ephy_amm_mention_danger.csv" : Informations relatives aux mentions de danger associées aux produits de E-phy disposant d’une AMM.
  • "ephy_amm_phrase_risque.csv" : Informations relatives aux phrases de risque associées aux produits de E-phy disposant d’une AMM.
  • "c3po_source.csv" : Table comportant les métadonnées relatives à chaque source de données intégrées à la version correspondante de la base C3PO.
  • "c3po_version.csv" : Table comportant les métadonnées relatives à la version correspondante de C3PO.

Les données sont encodées en UTF-8, séparées par un point-virgule, le point est utilisé comme séparateur décimal, les données de type Texte sont encadrées par des double quotes.


Diffusion des données

L'Office Français de la Biodiversité (OFB) a initié la base de données C3PO et réalisé les traitements nécessaires à sa production à partir des sources de données ouvertes détaillées sur cette page. Les scripts Notebook Jupyter (python) permettant de mettre à jour les fichiers .csv diffusés sur cette page sont accessibles sur la page suivante : https://gitlab.com/data-challenge-gd4h/c3po/-/tree/main (licence Cecill-B v1).

Producer

Latest update

December 10, 2024

License

Licence Ouverte / Open Licence version 2.0

Metadata quality
44.44444444444444/100

Files documentation missing

Update frequency not set

File formats are closed

Temporal coverage not set

There are no reuses for this dataset yet.

Publish a reuse What's a reuse ?

There are no discussions for this dataset yet.

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

Temporality

Creation

December 9, 2024

Latest update

December 10, 2024

Spatial coverage

Territorial coverage

Territorial coverage granularity

Other

Actions

Embed

Extras

dcat

{'license': ['http://inspire.ec.europa.eu/metadata-codelist/LimitationsOnPublicAccess/noLimitations', 'Licence Ouverte Etalab 2, https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf']}

Harvest

modified_at

None

remote_url

None

archived_at

None

archived

None

backend

CSW-DCAT

created_at

2024-12-09 09:00:00

source_id

66632580d7365f18b2c81902

remote_id

74d0a89e-c37c-4ec6-ae21-0de17599ae3f https://data.ofb.fr/catalogue/74d0a89e-c37c-4ec6-ae21-0de17599ae3f

domain

data.ofb.fr

last_update

2024-12-26 00:09:31.775000

uri

http://localhost:8080/geonetwork/srv/resources/datasets/74d0a89e-c37c-4ec6-ae21-0de17599ae3f https://data.ofb.fr/catalogue/74d0a89e-c37c-4ec6-ae21-0de17599ae3f

dct_identifier

74d0a89e-c37c-4ec6-ae21-0de17599ae3f https://data.ofb.fr/catalogue/74d0a89e-c37c-4ec6-ae21-0de17599ae3f

Statistics for the year

Views

235

235 in Dec 2024

Downloads

6

6 in Dec 2024

Reuses of this dataset

0

Followers

0