Cet article est en ligne depuis longtemps. Il est possible que la réponse proposée ne soit plus d'actualité.
Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page, mais je me heurte au nombre maximum d’entrées par pages, et j’aurais souhaité une meilleure solution.
Vous pouvez télécharger la liste des ouvrages du corpus au format PDF disponible dans les informations générales du site de documentation. Chaque référence bibliographique est suivie d’informations entre accolades. Il s’agit de la cote et du nombre de mots.