Comment rechercher toutes les occurrences du verbe suivre ?

Comment rechercher les formes de suis qui sont des occurrences du verbe suivre, en laissant de côté celles qui sont des occurrences du verbe être ?

Dans la recherche Avancée, lorsque vous cherchez [lemma="suivre"%c & pos="V|VINF|VPP|VPR"%c], vous ne récupérez aucune occurrence de suis, car la lemmatisation dans Frantext ne gère pas l'ambiguïté. De façon déterministe, toutes les occurrences d'une forme donnée sont associées au même lemme. Dans le cas de suis, il s'agit du lemme être et non suivre.

Si vous cherchez &lexique("moderne","suivre","VINF"), vous récupérez des formes étiquetées NCADJ et P. En effet, il s'agit des formes "suivant", "suivi", "suivie", "suivies" et "suivis" qui peuvent bel et bien être des noms communs, des adjectifs ou des prépositions. Mais aussi à cause de quelques erreurs d'étiquetage comme par exemple dans "dont une suivie d'un immense passage d'avions" "suivies" est pris pour un nom commun précédé d'un déterminant DET + NC.

Pour contourner les limites de la lemmatisation et obtenir des occurrences de l'ensemble des formes fléchies du verbe suivre dont l'étiquette morphosyntaxique correspond à un verbe conjugué ou à l'infinitif, vous pouvez utiliser l'expression CQL suivante :

  • [word=&lexique("moderne","suivre","VINF") & pos="V|VINF|VPP|VPR"%c]

Explication : avec cette expression CQL, on recherche les formes fléchies du verbe suivre à partir du lexique moderne, mais en limitant les résultats aux étiquettes morphosyntaxiques de verbes. De cette manière, il manquera toujours des occurrences à cause des erreurs d'étiquetage, mais l'exploitation conjointe des listes de formes fléchies générée par un lexique ainsi que des étiquettes morphosyntaxiques permet d'obtenir des résultats pertinents.

À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.