Dossiers fictifs de médecine générale

Name: Dossiers fictifs de médecine générale
Creator: Défi iDoc Santé
License: https://www.etalab.gouv.fr/wp-content/uploads/2014/05/Licence_Ouverte.pdf

Description

Ce jeu d'exercice comporte des dossiers fictifs de médecine générale sous format json proposés pour le Défi iDoc Santé (défi 1A).

Motivations pour la création du jeu de données

Pourquoi le jeu de données a-t-il été initialement créé ?

Ces dossiers médicaux figurent des notes fictives de médecins généralistes dans leur activité de premier recours au cours de consultations successives. Ces informations constituent l'essentiel de la traçabilité constitué par le professionnel de santé dans son dossier médical.

Ce jeu de données a été créé pour le défi 1A du Défi iDoc Santé, qui vise à identifier automatiquement les recommandations de bonnes pratiques pertinentes dans les situations cliniques décrites dans ces dossiers médicaux.

Pour quelles autres tâches le jeu de données pourrait-il être utilisé ?

Des dossiers médicaux réels pourraient être utilisés pour effectuer des recherches, études ou évaluations sur la qualité des soins et les pratiques des professionnels mais ce n'est pas le cas pour les données présentées ici qui sont fictives.

Quelles sont les utilisations trompeuses du jeu de données ? Le format de ces données n'est proposé que pour le défi 1A du Défi iDoc Santé. Il est conforme à aucune norme d'interopérabilité, la HAS et ses partenaires dans ce concours ne promeuvent en aucun cas d'autre usage de ce format.

Qui a financé ou soutenu la création du jeu de données ? La HAS est à l'origine de la rédaction de ces dossiers médicaux fictifs. Ils s'inspirent de véritables dossiers médicaux extraits de son logiciel de gestion de cabinet par Philippe Szidon, médecin généraliste à Paris. De ces dossiers médicaux, les épisodes d'histoires pathologiques emblématiques ont été extraits, les dates décalées aléatoirement et les détails changés. Ces « histoires pathologiques » ont ensuite été regroupées de façon aléatoire pour fabriques des histoires possibles de patients de médecine générale.
Des balises ont ensuite été insérées pour produire un document json. Ces traitements ont été réalisés par Pierre Liot, HAS.

Composition du jeu de données

Que contient le jeu de données principalement ? Les principales informations de ces données sont des informations médicales et des prescriptions.

Dispose-t-on d'un schéma décrivant les variables du jeu de données ?

Oui. Le schéma json du document est fourni. Il ne correspond à aucun standard.

Que contient chaque champ du jeu de données ?

Le jeu de données est une liste de patients, qui comprend chacun les informations de sex, date de naissance, et une liste de prescription.

Les balises json sont explicites et en français :

Sex : sexe
DDN : date de naissance
Consultations : liste de consultations contenu d'une consultation
Date_consultation : date de la consultation
Resultat_consultation : diagnostics et problèmes principaux justifiant la consultation. A noter que ces contenus comportent de nombreux libellés de CISP2
Biometrie : constantes cliniques
Biologie : résultats d'examen biologique
Accident_travail : contenu du formulaire « Accident du travail »
Text : autres notes prises lors de la consultation

Est-ce que le contenu du jeu de données dépend de ressources externes ? Non.

De quelles garanties dispose-t-on concernant la pérennité de ces ressources ? Le contenu médical ne dépend pas de sources externes.

Processus de collecte des données

Comment les données ont été collectées (avec des capteurs, manuellement par des outils informatiques…) ? Les dossiers médicaux d'origine, servant d'inspiration, ont été saisies manuellement dans le logiciel de gestion de cabinet d'un médecin généraliste.

Qui a assuré le processus de collecte de données (des agents, des bénévoles, des étudiants…) ? Les dossiers initiaux ont été saisies par Philippe Szidon, médecin généraliste à Paris. Les dossiers inventés ont été saisis par Pierre Liot (HAS, neurologue) dans des outils bureautiques en s'inspirant des dossiers réels affichés via un script spécifique.

Quelle a été la période de collecte des données ? De janvier 1998 à mai 2022 pour les dossiers initiaux.

Les données ont-elles été collectées directement ou inférées à partir d'autres données ? Les données ont été créées en s'inspirant de données collectées directement.

Les données ont-elles été collectées sur un échantillon ? Selon quelles méthodes ? Ces données représentent un échantillon très restreint, défini heuristiquement par un professionnel de santé pour illustrer une variété de situations cliniques.

Quelles sont les erreurs connues, les limites, les sources de bruit ou de redondances associées à ces données ? Ces données ne sont ni exhaustives ni représentatives. Elles ne sont qu'une illustration de situations cliniques emblématiques et fréquentes telles qu'on peut les trouver dans les dossiers médicaux d'un médecin de premier recours. Elles ne sont pas publiées selon un format standard.

Pré-traitement des données

Comment les données ont-elles nettoyées ou préparées ? Ces dossiers médicaux ne comportent pas de nom, aucune date (naissance, consultation, arrêt ou accident de travail, …) n'est réelle. Aucune des associations pathologiques des fiches initiales n'a été conservée dès lors qu'elle n'avait pas de relation médicale connue. Ces dossiers médicaux publiés sont donc inventés et sans relation avec de réels patients.

Les données « brutes » ont-elles été conservées ? Sont-elles diffusées ? Les données sources, les dossiers médicaux ayant servi d'inspiration, ne sont pas diffusées.

L'outil de prétraitement des données est-il disponible ? Non.

Diffusion du jeu de données

Les données sont-elles diffusées en ligne ? Selon quelles modalités (sur un portail open data, un site web, une API…) ? Oui, sur cette page data.gouv.fr.

Selon quelle licence les données sont-elles diffusées ? License Ouverte version 2.0

Des redevances ou des restrictions sont-elles appliquées dans l'accès aux données ? Non.

Maintenance du jeu de données

Qui assure la maintenance du jeu de données ? Comment peut-on contacter cette personne ? Quel est le service responsable du jeu de données ? Ce jeu de données n'est pas maintenu. La publication est réalisée par la HAS.

Est-ce que les rôles sont distincts entre la production des données, leur éditorialisation et leur diffusion ? Non. La production de ces dossiers médicaux fictifs a été réalisée par la mission Data de la HAS qui en assure la diffusion.

Le jeu de données sera-t-il mis à jour ? Si oui, à quelle fréquence ? Non

Si les données deviennent obsolètes, comment cette information sera-t-elle communiquée ? Sur cette page.

Est-il possible de contribuer à l'amélioration des données ? Selon quelles modalités ? La mission data de la HAS est à l'écoute de toute proposition constructive.

Considérations légales et éthiques

Si le jeu de données concerne des individus, ont-ils exprimé leur consentement de manière claire ? Les dossiers médicaux fictifs ne concernent pas des individus.

Le jeu de données peut-il exposer de manière directe ou indirecte des individus ? Non. Les dossiers publiés sont fictifs.

Ces données sont-elles conformes au RGPD ? Oui

Les données peuvent-elles avantager ou désavantager des groupes sociaux ? Non.

Le jeu de données contient-il des informations pouvant être considérées comme inappropriées ou offensantes ? Non.

Producer

Défi iDoc Santé

Latest update

June 29, 2022

License

Licence Ouverte / Open Licence

Metadata quality

55.55555555555556/100

Update frequency not set

Temporal coverage not set

Spatial coverage not set

1 Main file ¹

dossiers-mg.json

Updated on June 29, 2022

json (20.2KB)

217 downloads

URL: https://static.data.gouv.fr/resources/dossiers-fictifs-de-medecine-generale/20220629-010250/dossiers-mg20220627.json
Permalink: https://www.data.gouv.fr/en/datasets/r/2cef249b-c507-4501-afdf-4581db4f5b48
sha1: c1647f7bdd745c8bcf822caadef82d7348ac2734
MIME Type: application/json

Created on: June 29, 2022
Modified on: June 29, 2022

Size: 20.2KB

2 Documentations ²

dossiers-mg-schema.json

Updated on June 29, 2022

json (2.0KB)

65 downloads

URL: https://static.data.gouv.fr/resources/dossiers-fictifs-de-medecine-generale/20220629-010302/dossiers-mg-schema.json
Permalink: https://www.data.gouv.fr/en/datasets/r/c2557b7e-a3e6-4d8e-bb7b-75709d5e6a2e
sha1: 8b778e544be1ce5b4ad1af7a76568c537a38f6d7
MIME Type: application/json

Created on: June 29, 2022
Modified on: June 29, 2022

Size: 2.0KB

dossiers-mg-documentation-json.docx

Updated on June 29, 2022

docx (31.1KB)

69 downloads

URL: https://static.data.gouv.fr/resources/dossiers-fictifs-de-medecine-generale/20220629-010233/dossiers-mg-documentation-json.docx
Permalink: https://www.data.gouv.fr/en/datasets/r/cc7ae665-bb15-4b78-8d02-04e148e902de
sha1: 26a92cd879bab46c8e7563a9de25b392d0db5ad8
MIME Type: application/vnd.openxmlformats-officedocument.wordprocessingml.document

Created on: June 28, 2022
Modified on: June 29, 2022

Size: 31.1KB

There are no reuses for this dataset yet.

Publish a reuse What's a reuse ?

There are no discussions for this dataset yet.

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

License

Licence Ouverte / Open Licence

ID

62b9ab52d0a69be37bb62706

Temporality

Creation

June 27, 2022

Frequency

Unknown

Latest update

June 29, 2022

Actions

Embed

<div data-udata-dataset="62b9ab52d0a69be37bb62706"></div><script data-udata="https://www.data.gouv.fr/" src="https://static.data.gouv.fr/static/oembed.js" async defer></script>

Statistics for the year

Download traffic metrics as CSV

Views

1.5k

103 in Dec 2024

Downloads

238

22 in Dec 2024

Dossiers fictifs de médecine générale

Description

Motivations pour la création du jeu de données

Composition du jeu de données

Processus de collecte des données

Pré-traitement des données

Diffusion du jeu de données

Maintenance du jeu de données

Considérations légales et éthiques

Producer

Latest update

License

Metadata quality:

Metadata quality

Information

Tags

License

ID

Temporality

Creation

Frequency

Latest update

Actions

Embed

Statistics for the year

Views

Downloads

Reuses of this dataset

Followers