Comment obtenir le nombre d'hapax ?

J'aimerais obtenir des données statistiques diachroniques sur l'usage des suffixes en français et notamment j'aimerais faire des mesures de productivité en comptant le nombre de lemmes, le nombre d'occurrences et le nombre d'hapax d'un suffixe, ce que Frantext permet de faire bien que cela ne soit pas automatisé. J'aimerais observer ces facteurs à l'échelle de l'ensemble du corpus intégral pour mettre en regard les différentes valeurs particulières. J'ai réussi à obtenir la liste des mots en utilisant l'onglet Fréquences et l'expression régulière .+ sur le corpus intégral. Le nombre total d'occurrences m'est fourni par les informations du corpus. Par contre, auriez-vous une solution simple pour obtenir le nombre d'hapax ?

Pour trouver le nombre d'hapax depuis l'onglet Fréquences, il suffit de sélectionner l'action Réduire dans le menu de gauche et de choisir un minimum et un maximum de 1. Cela vous donnera directement le nombre de mots de fréquence 1.

LIste hapax
Liste des hapax
À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.