Est-ce que c'est possible d'utiliser la fonction Fréquence pour chercher "en effet" (et d'autres collocations) pour voir la fréquence par million de mots ? Je n'ai réussi qu'avec "en outre".
Du fait de la segmentation des mots, vous devez utiliser des expressions CQL pour parvenir à vos fins, ce que ne permet pas l'onglet Fréquences. Effectuez plutôt une recherche Avancée, puis utilisez une action de Fréquence sur le Pivot.
- Exemple
([word="en"%cdl] [word="effet"%cdl])|[word="en outre"%cdl]
Explication : "En effet" est segmenté en 2 parties, tandis que "en outre" est considéré comme un segment unique. Nous recherchons donc le groupe des formes graphiques "en" et "effet", ou la forme graphique "en outre".
Pour calculer la fréquence par million de mots équivalente à celle de l'onglet Fréquences, vous devez diviser le Nombre d'occurrences par le Nombre de tokens dans le corpus, puis multiplier le tout par 1 000 000.
Le Nombre de tokens dans le corpus est disponible sous l'onglet Corpus, Voir le corpus puis sous l'onglet Informations situé dans la colonne de gauche. Attention, contrairement à l'onglet Fréquences, le nombre de résultats dans la recherche Simple, Assistée ou Avancée est limité à 100 000.
La segmentation, les expressions CQL, la limite de 100000