DATAtourisme, la base nationale des données publiques d'information touristique en Open Data DATAtourisme

Description

[Dernière Modification de la description au 05/06/2024 - voir plus bas]

DATAtourisme est un dispositif national de collecte et de diffusion en open data des données institutionnelles relatives au recensement de l'offre touristique : description des points d'intérêt et événements touristiques géolocalisés et qualifiés.

Porté par l’Etat de 2015 à janvier 2022, et piloté par ADN Tourisme depuis le 1er février 2022, il est né d’une coopération inédite avec les réseaux des offices de tourisme, des agences départementales et des comités régionaux du tourisme de l’ensemble du territoire national.

Important : le périmètre du dispositif DATAtourisme porte sur le recensement de l'offre. Il ne comporte pas d'éléments statistiques tels que la fréquentation touristique, la capacité d'accueil, etc. L'offre recensée porte sur les éléments publiés volontairement par les territoires, sans garantie d'exhaustivité.

Directement connectée aux bases de données territoriales, la plateforme nationale DATAtourisme permet un accès plus large et simplifié aux données publiques d’information touristique, au moyen de :
        -    Une technologie capable d’agréger et mettre à jour quotidiennement plusieurs dizaines de jeux de données qualifiées,
        ˗    Une ontologie nationale permettant de retranscrire l’intégralité des données touristiques en un vocabulaire et un format uniformisé
        ˗    Plusieurs services et une API permettant d’exploiter finement des données répondant à des besoins personnalisés
        ˗    Une licence d’exploitation unique et ouverte (Licence ouverte 2.0)

Lauréat du Programme Investissements d’Avenir, ce dispositif participe à la boîte à outils gouvernementale pour décliner la stratégie touristique nationale telle que définie par le Comité Interministériel du Tourisme.


Jeux de données disponibles :
        •    export complet et quotidien des données présentes sur la plateforme DATAtourisme, au format NT
        •    export quotidien simplifié des données de type « événement » (FMA) au format CSV
        •    export quotidien simplifié des données de type « lieux » (PLACE) au format CSV
        •    export quotidien simplifié des données de type « visites et activités » (PRODUCT) au format CSV
        •    export quotidien simplifié des données de type « itinéraires » (TOUR) au format CSV

Les fichiers CSV simplifiés contiennent actuellement les champs de description suivants :
        •    Titre ou nom du POI (label)
        •    Catégories de POI (type) (Il s'agit des identifiants des types, séparés par des barres verticales ( | ). Pour obtenir le libellé en français, il faut se référer au thésaurus.)
        •    Périodes regroupées (pour le fichier FMA uniquement) (Il s'agit d'objets au format date(AAAA-mm-jj)<->date(AAAA-mm-jj), la première étant la date de début et la dernière la date de fin. Différentes périodes sont concaténées par des barres verticales ( | )).
        •    Latitude (WGS 84)
        •    Longitude (WGS 84)
        •    Adresse postale
        •    Code postal et commune (postalcode + city; séparés par des dièse ( # )).
        •    Créateur de la donnée
        •    Réseau ou SIT source,
        •    Date de mise à jour (lastupdate)
        •    Contacts du POI (Il s'agit d'objets (noms#urls) concaténés par des barres verticales ( | ). Les champs noms et urls sont respectivement des noms et des url qui sont concaténées par des diamants ( <> ). Chaque contact dans cette colonne garde ses # de manière obligatoire, ce qui permet de savoir en fonction du nombre de # déja comptés s'il s'agit d'un nom ou d'une url.
        •    Classements du POI (Il s'agit d'objets (noms#notes) concaténés par des barres verticales ( | ).
        •    Description (champ libre multiligne). Pour certains POI, les tarifs sont indiqués dans la description.
        •    Covid19 : mesures spécifiques (champ libre multiligne) : détail des mesures sanitaires prises par l’établissement ou le site touristique pour accueillir le public (attention, la mise à jour de ces information est moins fréquente depuis 2022).
        •    ID du POI (URI)


EVOLUTIONS APPORTEES A LA PAGE ET AUX FICHIERS :

Le 05/06/2024 : suppression de l'historique des fichiers
        •     Veuillez noter que d'ici quelques jours, l'historique des fichiers antérieurs à la date du jour sera supprimé. Les données continueront à être mises à jour quotidiennement via des fichiers qui "annuleront et remplaceront" systématiquement ceux de la veille. Cela aura l'avantage de faciliter l'accès aux données pour les réutilisateurs puisque le nom des fichiers sera stable (sans mention de date), et d'améliorer le temps de chargement de la page.

Le 15/07/2019, trois nouveaux champs ont été créés avant ID du POI :
        •    Contacts du POI (Il s'agit d'objets (noms#telephones#emails#urls) concaténés par des barres verticales ( | ). Les champs noms, telephones, emails et urls sont respectivement des numéros de téléphone (format international), des adresses emails et des url qui sont concaténées par des diamants ( <> ). Chaque contact dans cette colonne garde ses # de manière obligatoire, ce qui permet de savoir en fonction du nombre de # déja comptés s'il s'agit d'un nom, d'un téléphone, d'un email ou d'une url.
        •    Classements du POI (Il s'agit d'objets (noms#notes) concaténés par des barres verticales ( | ).
        •    Description (champ libre multiligne). Pour certains POI, les tarifs sont indiqués dans la description.

Le 16/06/2020, trois nouveaux champs ont été créés (après Code postal et commune) :
        •    Covid19 : mesures spécifiques (champ libre multiligne) : détail des mesures prises par l’établissement ou le site touristique pour accueillir le public durant la crise sanitaire
        •    Covid19 : est en activité (true/false) : information sur la confirmation de réouverture de l’établissement
        •    Covid19 : périodes d’ouverture confirmées (true/false) : true si les périodes d’ouverture ont été mises à jour à l’issue de la période de confinement du printemps 2020

Le 26/11/2020, 13 nouveaux fichiers ont été mis à disposition :
        •    Export quotidien simplifié des données au format CSV, découpé par région administrative : datatourisme.reg-CodeIsoRégional.date.csv,
        •    1 fichier par région administrative, rassemblant les POI de type FMA, PLACE, PRODUCT, TOUR,
        •    Liste des codes ISO : ARA (Auvergne Rhône Alpes), BFC (Bourgogne Franche Comté), BRE (Bretagne), COR (Corse), CVL (Centre Val de Loire), GDE (Grand Est), GLP (Guadeloupe), GUF (Guyane), HDF (Hauts de France), IDF (Ile de France), MTQ (Martinique), MYT (Mayote), NAQ (Nouvelle Aquitaine), NOR (Normandie), OCC (Occitanie), PAC (Provence Alpes Côte d’Azur), PDL (Pays de la Loire), REU (Ile de la Réunion).

Le 24/01/2022, le nom généré des fichiers a été mis à jour
        •    Tous les fichiers csv passent d'un format type.permietre.date.csv à un format type-perimetre-date.csv, dans le but d'obtenir un typage natif par la plateforme data.gouv.fr consistant ("csv") avec le type mime des fichiers.

Le 14/12/2023, le contenu des fichiers CSV simplifiés a été mis à jour
        •    Seules les URL sont disponibles pour le champs contact, les adresses email et numéros de téléphone ont été retirés.
        •    Les champs Covid19_est_en_activite et Covid19_periodes_d_ouvertures_confirmees ont été également retirés.

De manière synthétique :
( | ) sépare les objets
( # ) sépare les propriétés pour chaque objet
( <> ) sépare plusieurs valeurs pour chaque propriété

Les fichiers csv sont encodés en UTF-8, le séparateur de colonne est la virgule et les valeurs non triviales sont encapsulées dans des guillemets doubles ( " ).


Pour accéder aux données et aux services de la plateforme (création de flux sur mesure et choix des formats) : https://www.datatourisme.fr

Pour en savoir plus et rejoindre la communauté : https://info.datatourisme.fr/

Documentation et autres outils utiles : https://gitlab.adullact.net/adntourisme/datatourisme

Découvrir l’ontologie DATAtourisme, le format national sémantique pour les données d’information touristique :
        https://gitlab.adullact.net/adntourisme/datatourisme

En savoir plus sur le format N-Triples : https://www.w3.org/TR/n-triples/

Initiation à RDF : https://www.emse.fr/~zimmermann/W3C/RDF1.1Primer/


Pour obtenir de l’aide dans le paramétrage et l’exploitation des données de la plateforme : https://support.datatourisme.fr/ (espace d’entre-aide accessible depuis votre compte Diffuseur)

Producer

Latest update

November 21, 2024

License

Licence Ouverte / Open Licence

Metadata quality
100.0/100

There are no community resources for this dataset yet.

Share your resources Learn more about the community

Information

Temporality

Creation

July 26, 2018

Frequency

Daily

Temporal coverage

2018/10/09 to 2030/12/31

Latest update

November 21, 2024

Spatial coverage

Territorial coverage

France

Territorial coverage granularity

Country

Actions

Embed

Statistics for the year

Views

24.1k

1.6k in Nov 2024

Downloads

17.6k

141 in Nov 2024

Reuses of this dataset

13

1 in Nov 2024

Followers

10

1 in Nov 2024