Comment extraire les métadonnées du corpus ?

Je souhaite extraire les métadonnées du corpus (j’ai essentiellement besoin de la cote, de la date et du nombre de mots de chaque document) à partir du code source de la page, mais je me heurte au nombre maximum d’entrées par pages, et j’aurais souhaité une meilleure solution.

Comment calculer la fréquences relatives par ouvrages ?

Dans une ancienne version de Frantext, on pouvait avoir accès aux fréquences absolues et relatives. Comment trouver l’ouvrage de Duras qui contient la plus haute concentration des mots de la liste « sommeil » suivante : sommeil, dormir, fatigue, fatigué, endormir, somnoler, léthargique, dormeur et léthargie ?