Comment étudier la fréquence des mots composés ?

Est-ce que c'est possible d'utiliser la fonction Fréquence pour chercher "en effet" (et d'autres collocations) pour voir la fréquence par million de mots ? Je n'ai réussi qu'avec "en outre".

Action de fréquence sur une recherche Avancée (CQL)
Action de fréquence sur une recherche Avancée (CQL)

Du fait de la segmentation des mots, vous devez utiliser des expressions CQL pour parvenir à vos fins, ce que ne permet pas l'onglet Fréquences. Effectuez plutôt une recherche Avancée, puis utilisez une action de Fréquence sur le Pivot.

  • Exemple ([word="en"%cdl] [word="effet"%cdl])|[word="en outre"%cdl]

Explication : "En effet" est segmenté en 2 parties, tandis que "en outre" est considéré comme un segment unique. Nous recherchons donc le groupe des formes graphiques "en" et "effet", ou la forme graphique "en outre".

Pour calculer la fréquence par million de mots équivalente à celle de l'onglet Fréquences, vous devez diviser le Nombre d'occurrences par le Nombre de tokens dans le corpus, puis multiplier le tout par 1 000 000.

Le Nombre de tokens dans le corpus est disponible sous l'onglet Corpus, Voir le corpus puis sous l'onglet Informations situé dans la colonne de gauche. Attention, contrairement à l'onglet Fréquences, le nombre de résultats dans la recherche Simple, Assistée ou Avancée est limité à 100 000.

Nombre de tokens dans un corpus
Nombre de tokens dans un corpus
À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.