Comment extraire les métadonnées du corpus ?

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page, mais je me heurte au nombre maximum d’entrées par pages, et j’aurais souhaité une meilleure solution.