Comment obtenir les mêmes chiffres dans la recherche Simple et la recherche Avancée ?

J'ai fait une recherche sur le nombre d'occurrences de "pendant que/qu'" dans un corpus du 17e siècle, par la recherche simple et par la recherche avancée mais le nombre d'occurrences obtenu n'est pas le même. Y a-t-il une raison pour que ces chiffres diffèrent ?

sdfghdfgh
Une recherche Avancée de "pendant que/qu"'

Oui, la recherche Simple utilise un algorithme de recherche spécifique qui prend en compte les formes composées. Les résultats dépendent également d'une éventuelle sensibilité à la casse et aux diacritiques. Pour vous rapprocher des résultats de la recherche Simple, il vous faut donc tenir compte des variantes d'écritures dans votre recherche Avancée, grâce aux modificateurs. %c permet de ne pas tenir compte de la casse des caractères, et %d permet d'élargir la recherche aux diacritiques. Ainsi, dans votre cas, l'expression CQL [word="pendant"%cd] [word="que|qu'"%cd] vous permet de trouver sensiblement le même nombre d'occurrences qu'en additionnant celles issues des recherches Simples de pendant que et de pendant qu'.

À propos de Gilles Toubiana

Membre de l'équipe Frantext, il s'occupe notamment des abonnements, de l'assistance auprès des utilisateurs, de la numérisation des ressources textuelles et de la rédaction de documentations.