Comment extraire les métadonnées du corpus ?

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page, mais je me heurte au nombre maximum d’entrées par pages, et j’aurais souhaité une meilleure solution.

Comment chercher rapidement dans une période ?

J'ai besoin de pouvoir faire des recherches grammaticales sur des tranches de date. Par exemple, sur tous les textes entre 2000 et 2002, puis une autre recherche entre 1850 et 1900, et cela très rapidement. Comment dois-je m'y prendre ?