Comment exclure des co-occurrences ?

Nous faisons une recherche de Co-occurrences pour trouver des exemples de "un moment donné" non précédé de "à". Nous avons coché la case "exclu" sur la séquence 2 constituée de "à", en indiquant bien séquence 1 après 2 comme positions relatives des séquences. Or, dans les résultats que nous obtenons le "à" n'est pas exclu.

Votre requête est correctement formulée si vous avez également défini l'écart minimal entre les 2 séquences et coché la case check_box Sensible aux diacritiques. Le problème que vous pouvez rencontrer est toutefois celui ou le "à" n'est pas placé juste avant "un moment donné" (position -1), mais 1 mot avant,  et lorsque "l'unité lexicale" située entre les 2 n'est pas visible à l'écran. Il peut s'agir par exemple d'une balise XML telle qu'un retour à la ligne.

Pour trouver vos exemples, utilisez plutôt une recherche Avancée avec une requête CQL du type :

  • [word!="à"%cd] &développer("un moment donné"%cd)

Explication : Nous recherchons une première forme graphique différente != de "à", sans tenir compte de la casse ou des signes diacritiques %cd. Cette forme est suivie d'une suite de mots &développer("").

Vous pourrez ensuite utiliser les actions Modifier la taille du pivot (Nombre de mots avant : -1) puis Fréquence (Position : Contexte gauche). Vous pouvez également enlever du bruit en supprimant la ponctuation avec une requête du type :

  • [word!="[à.,:…!]+"%cd] &développer("un moment donné"%cd)
exclure des cooccurrences
Exclure des résultats de co-occurrences
À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.