Comment obtenir le nombre d'hapax ?

J'aimerais obtenir des données statistiques diachroniques sur l'usage des suffixes en français et notamment j'aimerais faire des mesures de productivité en comptant le nombre de lemmes, le nombre d'occurrences et le nombre d'hapax d'un suffixe, ce que Frantext permet de faire bien que cela ne soit pas automatisé. J'aimerais observer ces facteurs à l'échelle de l'ensemble du corpus intégral pour mettre en regard les différentes valeurs particulières. J'ai réussi à obtenir la liste des mots en utilisant l'onglet Fréquences et l'expression régulière .+ sur le corpus intégral. Le nombre total d'occurrences m'est fourni par les informations du corpus. Par contre, auriez-vous une solution simple pour obtenir le nombre d'hapax ?

Comment afficher la fréquence par document ?

J’ai besoin de trier des milliers de résultats par œuvre (et je ne peux donc pas commencer par limiter mes corpus à des œuvres particulières). Comment savoir dans lesquelles les mots que je cherche figurent le plus fréquemment ?