Open Bilbio corpus for content analysis

Description

Description of the corpus

The corpus describes fulltexts publication in sciences (mathemtaics, computing, statistics) in LATEX or TXT format.
They are published in open access.

Purprose to use this corpus is twice :

  • information extraction (for instance: extract all collocations around a target word, or extract methods names)
  • comparison of abstract and body text

size of publication corpus : 650,000
size of publication sample : 20

data :

body string text data

Auteur

Ce jeu de données a été publié à l'initiative et sous la responsabilité de nicolas turenne.

Dernière mise à jour

12 octobre 2023

Licence

Creative Commons Attribution

Qualité des métadonnées
66.66666666666666/100

Fréquence de mise à jour non respectée

Couverture spatiale non renseignée

Certains fichiers ne sont pas disponibles

Il n'y a pas encore de réutilisation pour ce jeu de données.

Publiez une réutilisation Qu'est-ce qu'une réutilisation ?

Il n'y a pas encore de discussion pour ce jeu de données.

Il n'y a pas encore de ressources communautaires pour ce jeu de données.

Partagez vos ressources En savoir plus sur la communauté

Informations

Mots-clés

ID

5840026288ee383a2cc65bb3

Temporalité

Création

1 décembre 2016

Fréquence

Semestrielle

Couverture temporelle

01/01/1994 à 01/07/2014

Dernière mise à jour

12 octobre 2023

Actions

Intégrer sur votre site

Visites

613

35 en nov. 2024

Téléchargements

47

1 en nov. 2024

Réutilisations de ce jeu de données

0

Favoris

0