Je cherche une liste de 25 000 mots les plus fréquemment utilisés dans le corpus écrit. Existe-t-il une telle fonctionnalité de recherche ?
Étiquette : fréquences
Comment rechercher des variantes par siècles ?
Comment comptabiliser l'effectif par siècle d'une dizaine de conjonctions de subordination avec leurs variantes ? Je ne peux pas vérifier à la main l'effectif de chaque recherche.
Comment obtenir le nombre d'hapax ?
J'aimerais obtenir des données statistiques diachroniques sur l'usage des suffixes en français et notamment j'aimerais faire des mesures de productivité en comptant le nombre de lemmes, le nombre d'occurrences et le nombre d'hapax d'un suffixe, ce que Frantext permet de faire bien que cela ne soit pas automatisé. J'aimerais observer ces facteurs à l'échelle de l'ensemble du corpus intégral pour mettre en regard les différentes valeurs particulières. J'ai réussi à obtenir la liste des mots en utilisant l'onglet Fréquences et l'expression régulière
.+
sur le corpus intégral. Le nombre total d'occurrences m'est fourni par les informations du corpus. Par contre, auriez-vous une solution simple pour obtenir le nombre d'hapax ?
Comment obtenir la fréquence de la ponctuation ?
J'aimerai obtenir la fréquence des signes de ponctuation sur tout le corpus. Comment faire ?
Comment afficher la fréquence par document ?
J’ai besoin de trier des milliers de résultats par œuvre (et je ne peux donc pas commencer par limiter mes corpus à des œuvres particulières). Comment savoir dans lesquelles les mots que je cherche figurent le plus fréquemment ?