Open Bilbio corpus for content analysis
Description
Description of the corpus
The corpus describes fulltexts publication in sciences (mathemtaics, computing, statistics) in LATEX or TXT format.
They are published in open access.
Purprose to use this corpus is twice :
- information extraction (for instance: extract all collocations around a target word, or extract methods names)
- comparison of abstract and body text
size of publication corpus : 650,000
size of publication sample : 20
data :
body string text data
Auteur
Ce jeu de données a été publié à l'initiative et sous la responsabilité de nicolas turenne.
Dernière mise à jour
12 octobre 2023
Licence
Qualité des métadonnées :
Description des données renseignée
Fichiers documentés
Licence renseignée
Fréquence de mise à jour non respectée
Formats de fichiers standards
Couverture temporelle renseignée
Couverture spatiale non renseignée
Certains fichiers ne sont pas disponibles
Qualité des métadonnées
Fréquence de mise à jour non respectée
Couverture spatiale non renseignée
Certains fichiers ne sont pas disponibles
Il n'y a pas encore de réutilisation pour ce jeu de données.
Il n'y a pas encore de discussion pour ce jeu de données.
Il n'y a pas encore de ressources communautaires pour ce jeu de données.
Informations
Mots-clés
Licence
ID
5840026288ee383a2cc65bb3
Temporalité
Création
1 décembre 2016
Fréquence
Semestrielle
Couverture temporelle
01/01/1994 à 01/07/2014
Dernière mise à jour
12 octobre 2023
Actions
Intégrer sur votre site
Statistiques des 12 derniers mois
Visites
613
Téléchargements
47
Réutilisations de ce jeu de données
0
Favoris
0