Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page mais je me heurte au nombre maximum d’entrée par pages, et j’aurais souhaité une meilleure solution.
Corpus 900-1350
Je suis en train de constituer un corpus de textes de 900 à 1350. Lorsque je saisi 900-1350 dans le champs Rechercher dans tous les textes, je n’obtiens aucun résultat. Comment faire ?
Comment dénombrer les mots et la ponctuation d'un corpus ?
Est-ce que le nombre total de mots du corpus tient compte de la ponctuation ? J’ai besoin de cette information.
Signaler des erreurs
Y a-t-il une procédure pour signaler les erreurs du corpus ?
Taille des corpus
Quelle est la taille (en mots) des corpus partiels 20ème siècle et Contemporain ? Est-il possible qu’il y ait des textes identiques dans ces deux corpus ? Et s’il y a des intersections, comment puis-je les identifier ?