Collecte du web consacrée à l'épidémie de Covid-19
Description
Dans le cadre de sa mission patrimoniale de dépôt légal de l’internet, la Bibliothèque nationale de France collecte régulièrement un échantillon du web français, constitué à partir de collectes larges et de collectes ciblées. Ces dernières regroupent les collectes « courantes » (pour les sites de référence sur un champ disciplinaire donné) et les collectes « projet » (portant sur un événement ou un thème particulier). Ce jeu de données contient les URL des sites, en lien avec l’épidémie de Covid-19, collectés dans le cadre de collectes ciblées, entre le 1er février et le 31 juillet 2020.
Le jeu est constitué d’un fichier au format CSV rassemblant près de 4600 URL de sites, blogs, réseaux sociaux et vidéos. Ces contenus relatifs à l’épidémie de Covid-19 ont été collectés dans le cadre de la collecte Actualité éphémère, entre le 1er février et le 31 juillet 2020, soit de l’installation du virus, sur le sol français jusqu’à sa rémission, ce qui correspond à la fin de l’état d’urgence sanitaire (10 juillet 2020). Le fichier CSV comprend également des URL de sites collectés dans le cadre des collectes Vidéos et Instagram qui ont respectivement été réalisées en juin et en juillet 2020. Ces URL servent de point de départ à la constitution des archives de l’internet, consultables par les chercheurs dans les salles de recherche des différents sites de la BnF, ainsi qu’en accès distant dans les bibliothèques de dépôt légal imprimeur (BDLI), en région. La collection épidémie de Covid-19, consultable dans les Archives de l’internet Labs, regroupe, en plus des contenus collectés dans le cadre des trois collectes mentionnées ci-dessus, ceux réunis lors des collectes Presse payante et Actualités. Chaque URL est accompagnée d’informations descriptives (thème de la fiche ayant servi à réaliser la collecte, mots-clefs renseignés) et techniques (fréquence de collecte, historique de l'URL collectée) concernant la collecte. Il est cependant à noter que la fréquence de collecte indiquée dans le fichier CSV correspond à la dernière fréquence associée à l’URL du site à collecter. Cette colonne ne fait donc pas état des changements de fréquence qui ont pu intervenir au cours de la collecte.
Etant donné le caractère imprévisible de l’épidémie de Covid-19 en France, cette collecte n’a pas été réalisée dans le cadre d’une collecte projet s’inscrivant dans un calendrier donné. Les contenus ont donc, dans un premier temps, été sélectionnés lors de la collecte Actualité éphémère. Cinquante-deux correspondants ont participé de manière directe à cette vaste collecte. Une partie d’entre eux appartiennent au réseau des correspondants internes de la BnF tandis que les autres sont rattachés au réseau des correspondants régionaux (qui travaillent dans quinze établissements partenaires en région). Par la suite, deux autres collectes ont été réalisées en juin et juillet 2020 ; il s’agit des collectes Vidéos et Instagram.
Producteur
Dernière mise à jour
27 février 2023
Licence
Licence Ouverte / Open Licence
Qualité des métadonnées :
Description des données renseignée
Fichiers documentés
Licence renseignée
Fréquence de mise à jour non respectée
Formats de fichiers standards
Couverture temporelle renseignée
Couverture spatiale renseignée
Tous les fichiers sont disponibles
Qualité des métadonnées
Fréquence de mise à jour non respectée
Il n'y a pas encore de réutilisation pour ce jeu de données.
Il n'y a pas encore de discussion pour ce jeu de données.
Il n'y a pas encore de ressources communautaires pour ce jeu de données.
Informations
Mots-clés
Licence
ID
62d821668a1d8c9a9a71b5a0
Temporalité
Création
20 juillet 2022
Fréquence
Annuelle
Couverture temporelle
02/2020 à 07/2020
Dernière mise à jour
27 février 2023
Couverture spatiale
Couverture territoriale
France
Granularité de la couverture territoriale
Autre
Actions
Intégrer sur votre site
Statistiques des 12 derniers mois
Visites
646
Téléchargements
28
Réutilisations de ce jeu de données
0
Favoris
0