Extraire les métadonnées

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page mais je me heurte au nombre maximum d’entrée par pages, et j’aurais souhaité une meilleure solution.

Vous pouvez télécharger la liste des ouvrages du corpus au format PDF disponible dans les informations de mise à jour sur le site de documentation https://wiki.frantext.fr. Chaque référence bibliographique est suivie d’informations entre accolades. Il s’agit de la cote, de la date et du nombre de mots. Il est également possible d'exporter un corpus au format CSV depuis l'interface de Frantext.

À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.