Extraire les métadonnées

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page mais je me heurte au nombre maximum d’entrée par pages, et j’aurais souhaité une meilleure solution.

Corpus 900-1350

Je suis en train de constituer un corpus de textes de 900 à 1350. Lorsque je saisi 900-1350 dans le champs Rechercher dans tous les textes, je n’obtiens aucun résultat. Comment faire ?

Taille des corpus

Quelle est la taille (en mots) des corpus partiels 20ème siècle et Contemporain ? Est-il possible qu’il y ait des textes identiques dans ces deux corpus ? Et s’il y a des intersections, comment puis-je les identifier ?