J'ai fait une recherche sur le nombre d'occurrences de "pendant que/qu'" dans un corpus du 17e siècle, par la recherche simple et par la recherche avancée mais le nombre d'occurrences obtenu n'est pas le même. Y a-t-il une raison pour que ces chiffres diffèrent ?
Oui, la recherche Simple utilise un algorithme de recherche spécifique qui prend en compte les formes composées. Les résultats dépendent également d'une éventuelle sensibilité à la casse et aux diacritiques. Pour vous rapprocher des résultats de la recherche Simple, il vous faut donc tenir compte des variantes d'écritures dans votre recherche Avancée, grâce aux modificateurs. %c
permet de ne pas tenir compte de la casse des caractères, et %d
permet d'élargir la recherche aux diacritiques. Ainsi, dans votre cas, l'expression CQL [word="pendant"%cd] [word="que|qu'"%cd]
vous permet de trouver sensiblement le même nombre d'occurrences qu'en additionnant celles issues des recherches Simples de pendant que
et de pendant qu'
.