Comment extraire les métadonnées du corpus ?

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page, mais je me heurte au nombre maximum d’entrées par pages, et j’aurais souhaité une meilleure solution.

Détail du corpus intégral
Détail du corpus intégral

Vous pouvez télécharger la liste des ouvrages du corpus au format PDF disponible dans les informations générales du site de documentation. Chaque référence bibliographique est suivie d’informations entre accolades. Il s’agit de la cote et du nombre de mots.

À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.