Bases & Netsources Bases & Netsources Bases & Netsources Bases & Netsources
  • Accueil
    • Présentation générale
    • Conditions d'utilisation
    • Mentions légales
    • FAQ - Questions fréquentes
    • Nous contacter
    • Support technique
  • Nos Publications
    • Lire nos articles de Bases
    • Lire Bases en format PDF
    • Lire nos articles de Netsources
    • Lire Netsources en format PDF
    • Lire nos Brèves de veille (gratuit)
    • Rechercher dans les articles
  • Fiches pratiques
  • Tags
  • S'abonner
    • Bases - Format Web
    • Bases - Format Papier
    • Netsources - Format Web
    • Netsources - Format Papier
    • Bases & Netsources - Format Web
    • Bases & Netsources - Format Papier
  • Acheter
    • Numéros de Bases
    • Articles de Bases
    • Numéros de Netsources
    • Articles de Netsources
    • Nos fiches pratiques
    • Rechercher un produit
Bases & Netsources Bases & Netsources Bases & Netsources Bases & Netsources
  • Accueil
    • Présentation générale
    • Conditions d'utilisation
    • Mentions légales
    • FAQ - Questions fréquentes
    • Nous contacter
    • Support technique
  • Nos Publications
    • Lire nos articles de Bases
    • Lire Bases en format PDF
    • Lire nos articles de Netsources
    • Lire Netsources en format PDF
    • Lire nos Brèves de veille (gratuit)
    • Rechercher dans les articles
  • Fiches pratiques
  • Tags
  • S'abonner
    • Bases - Format Web
    • Bases - Format Papier
    • Netsources - Format Web
    • Netsources - Format Papier
    • Bases & Netsources - Format Web
    • Bases & Netsources - Format Papier
  • Acheter
    • Numéros de Bases
    • Articles de Bases
    • Numéros de Netsources
    • Articles de Netsources
    • Nos fiches pratiques
    • Rechercher un produit

Faut-il proscrire les opérateurs booléens sur Google ? nous avons testé

Carole Tisserand-Barthole
Bases no
380
publié en
2020.04
2807
Acheter le numéro
Tags
recherche Web | Google
Réduire Augmenter Taille de la police
Faut-il proscrire les opérateurs booléens sur Google ? nous ... Image 1

Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.

Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.

Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND (par défaut), OR et NOT (matérialisé sous la forme d’un tiret -).

Dans cet article, nous avons choisi de nous pencher sur l’opérateur OR qui est de plus en plus critiqué

Sur le papier, il est toujours possible d’entrer des mots-clés séparés par un OR :

  • Pour lister des synonymes sur Google tels que Coronavirus OR covid-19 OR SRAS 2, etc. ;
  • Pour utiliser plusieurs variantes d’un opérateur filetype:doc OR filetype:pdf ;
  • Ou pour rechercher le même terme sur plusieurs zones différentes comme intitle:data OR inurl:data par exemple.

 

Au lancement de Google et pendant de nombreuses années, utiliser ces opérateurs était très clairement un avantage pour bien rechercher sur le moteur. Il ne fallait surtout pas s’en priver.

Mais les évolutions technologiques de Google vers la recherche en langage naturel (où il recherche automatiquement sur les synonymes et termes proches) ou plus récemment l’implémentation de l’algorithme BERT qui permet de mieux comprendre l’intention derrière la question de l’utilisateur, éloigne toujours un peu plus le moteur des traditionnelles requêtes booléennes.

Dans le monde de l’information, on constate qu’il y a aujourd’hui deux écoles :

  • La première, essentiellement française qui continue d’utiliser de longues requêtes combinant des opérateurs booléens classiques sur Google (dans la limite des 32 termes, imposée par Google) ;
  • La seconde, anglo-saxonne, illustrée par des personnalités du monde de l’infodoc comme Marydee Ojala, Mary Helen Bates ou encore Irina Shamaeva (une figure du sourcing RH) qui insistent sur le fait qu’il faut absolument proscrire les longues requêtes combinant des synonymes sur Google.

Pour en avoir le cœur net, nous avons décidé de mener nos propres tests et de comparer les résultats.

Les recherches ont été menées en français et en anglais avec des questions plus ou moins conceptuelles et compliquées.

Google ne prend pas en compte les parenthèses

Même si Google permet l’usage des opérateurs booléens, on ne peut pas pour autant dire qu’il permet d’effectuer des requêtes booléennes, car il ne prend pas en compte les parenthèses. Google considère l’opérateur OR comme prioritaire.

Ainsi, si on souhaite réaliser la recherche suivante, Google n’en est tout simplement pas capable, car il ne reconnaît pas les parenthèses :

(A AND B) OR (C AND D).

Il interprète en réalité́ la requête de la façon suivante, ce qui n’a plus du tout la même signification :

A AND (B OR C) AND D

Recherche 1 : Dispositifs de reconnaissance des compétences acquises par les parents

Trouver des informations sur les dispositifs de reconnaissance par les entreprises des compétences acquises par les parents qui se sont occupés de leurs enfants pendant plusieurs années.

Cette première recherche très con­ceptuelle est complexe, car difficilement transposable en une requête avec quelques mots-clés. Elle requiert d’explorer différents champs lexicaux : celui des compétences, de la reconnaissance et de la valorisation, de l’entreprise/monde du travail, mais aussi celui de la famille.

Pour cela, nous avons donc listé des termes liés à la notion de compétences, de parents/aidants, de reconnaissance et des termes liés à la notion d’entreprise en français et en anglais.

  • Compétences, skills, qualifications, reconnaissance, atout, compétences, qualité, valeur ajoutée, benefits, qualities, assets, bénéfices, , recognition, valuable skills ;
  • Scheme, reconnaissance, recognition, program, programme, recrutement ;
  • Caregiver, family caregiver, parent, mère au foyer, stay at home mum;
  • Entreprises, companies workplace, travail, career.

On peut transcrire cette recherche sous la forme de la requête booléenne suivante :

(compétences OR skills OR qualifications OR reconnaissance OR atout OR qualité OR “valeur ajoutée” OR benefits OR qualities OR assets OR bénéfices OR recognition) AND (scheme OR reconnaissance OR recognition OR program OR programme OR recrutement) AND (“family caregiver” OR parent OR “mère au foyer” OR “stay at home mum”) AND (entreprise OR companies OR workplace OR travail OR career)

Nous avons mis des parenthèses pour plus de lisibilité pour nos lecteurs, mais on se rappellera que Google ne les prend pas en compte.

Nous avons ensuite relancé des requêtes plus courtes, sans utiliser l’opérateur OR mais avec des suites de mots-clés ou en langage naturel :

  • valuable skills stay at home parent companies program
  • reconnaissance des compétences des mères au foyer en entreprise 
  • etc.
Résultat :

Longue requête booléenne

Le résultat est ici catastrophique. Sur les 208 résultats proposés, aucun n’est pertinent...

Google ne comprend visiblement pas où nous voulons en venir.

Suite de requêtes courtes

Tous les résultats ne sont pas pertinents, mais on trouve un certain nombre de ressources intéressantes. Google a mieux compris ce que nous recherchions.

D’ailleurs, avec cette méthode, Google fait émerger dans les résultats des termes et concepts très pertinents que nous n’avions pas identifiés comme transferable skills ou returnship program. En relançant des requêtes spécifiquement sur ces concepts, on retrouve alors de nombreux documents et articles pertinents.

Recherche 2 : La surmortalité en Europe en 2020 liée au coronavirus

Pour une telle recherche, on pourra croiser des termes faisant référence :

  • A la surmortalité comme surmortalité, excess deaths, morts excessives, surplus, excess mortality, mortality statistics, excess rise ;
  • A l’Europe comme Europe, UK, Germany, France, Allemagne, Belgique, Italie, Royaume-Uni, Espagne, etc ;
  • Au Coronavirus : Coronavirus, covid-19, etc.

On pourrait donc entrer une longue requête du type :

(surmortalité OR excess deaths OR morts excessives OR surplus OR excess mortality OR mortality statistics OR excess rise) AND (Europe OR UK OR germany OR france OR allemagne OR Belgique OR Italie OR Royaume-uni OR Espagne OR spain OR Italy) AND (coronavirus OR covid-19)

Nous avons mis des parenthèses pour plus de lisibilité, mais on se rappellera que Google ne les prend pas en compte.

Pour les requêtes courtes, on pourra ainsi entrer :

  • surmortalité europe coronavirus
  • excess deaths europe covid
  • etc.
Résultat :

Longue requête booléenne

Cette fois-ci les résultats sont pertinents et répondent pour la plupart à la question posée. Néanmoins, on constate que sur les 151 résultats, tous sont en anglais. Google a compris la question, mais a fait le choix de privilégier la langue anglaise, peut-être parce que notre requête comporte plus de termes en anglais qu’en français.

Suite de requêtes courtes

Il y a quelques résultats communs avec ceux de la longue requête, mais également d’autres résultats pertinents qui n’étaient pas apparus.

Se limiter à une seule requête courte n’est néanmoins pas suffisant. Même si Google recherche automatiquement sur quelques de synonymes, il ne prend pas tout en compte et on passe à côté d’un certain nombre de résultats pertinents.

Recherche 3 : le marché de la balle de tennis

La longue requête booléenne pourrait par exemple prendre la forme suivante :

(marché OR market) AND (balle de tennis OR tennis ball) AND (2018 OR 2019 OR 2020)

Pour les requêtes courtes, voici quelques exemples :

  • marché balles de tennis
  • marché mondial balles de tennis
  • tennis ball market
  • tennis ball market worlwide
  • tennis ball market size
  • tennis ball market forecasts
  • etc.

On peut ensuite limiter aux résultats de moins d’un an pour avoir des données récentes, croiser les requêtes avec les noms des principaux fabricants identifiés, etc.

Résultat :

Longue requête booléenne

Une partie des résultats sont pertinents, les autres ne sont que des sites de vente de balles de tennis. Cela met en lumière l’un des objectifs premiers de Google qui est de faciliter la vente/l’achat de produits. Et cette fois-ci, Google a choisi essentiellement des résultats en français, probablement parce qu’il a tendance à favoriser les sites locaux pour les sites de vente en ligne.

Suite de requêtes courtes

En multipliant les requêtes courtes, on identifie de nombreux résultats intér­essants qui n’étaient pas apparus dans la première longue requête.

Notre conclusion

Même si techniquement il est toujours possible d’entrer de longues requêtes avec une liste de synonymes séparés par un OR sur Google, on a tout de même tendance à « s’auto-saborder » en faisant de la sorte.

Car Google ne fonctionne pas comme les bases de données classiques, il s’en éloigne même de plus en plus. Le moteur tente de comprendre l’intention de l’uti­lisateur et son besoin informationnel et va ensuite « piocher » une sélection de résultats (200 à 300 grand maximum) dans son gigantesque index. Les bases de données, elles, font ressortir TOUS les résultats qui contiennent les mots-clés demandés.

  • Face à de longues requêtes booléennes complexes, Google n’a aucune chance de comprendre ce que nous recherchons. Il réinterprète donc la requête comme il l’entend en excluant certains termes, en donnant plus de poids à d’autres, etc. Les résultats proposés ne sont alors absolument pas pertinents.

Cela ne signifie pas pour autant qu’il n’existe pas sur le Web de pages et documents pertinents sur ce sujet. Mais Google n’a tout simplement pas fait le lien entre notre question et les contenus présents dans son gigantesque index...

  • Pour des requêtes plus simples, Google a plus de chances de comprendre ce que nous souhaitons obtenir. Néanmoins, en se limitant à une seule longue requête booléenne, on n’accèdera pas à plus de 200/300 résultats, car Google n’en affiche jamais plus.

En relançant plusieurs requêtes, on élargit son champ des résultats possibles, car les 200/300 résultats affichés ne seront pas les mêmes (même s’il peut y avoir quelques recoupements).

En termes de méthodologie de re­cherche sur Google, on conservera donc une méthode classique en amont de la recherche en listant les termes et concepts importants, en listant les synonymes, termes proches, etc.

Mais on n’entrera pas tous ces termes en une seule fois dans Google. On relancera des requêtes courtes en variant le champ lexical.

Cela peut être chronophage certes, mais c’est le seul moyen de bien interroger Google aujourd’hui. On s’arrêtera quand on estimera avoir assez de matière pour répondre à sa question.

Et comme nous avons pu le voir, il est déconseillé d’entrer des requêtes qui combinent plusieurs langues, car Google fait toujours le choix d’en favoriser une. Mieux vaut partir du principe que 1 requête = 1 langue.

  • Précédent 280 / 624 Suivant
 Lire en format PDF

Articles connexes

Voir les mots clés

  • IA
  • brevets
  • médias sociaux
  • sourcing veille
  • professionnel de l'information
  • information business
  • agrégateurs de presse
  • conférences salons
  • information scientifique et technique
  • outils de recherche
  • outils de veille
  • tendances
  • actualités
  • méthodologie
  • serveur de bases de données
  • sommaire
  • Google
  • presse en ligne
  • recherche Web
  • évaluation outils

S'abonner

 Bases - Format Web
 Bases - Format Papier

Acheter un numéro

bases_no_446_sommaire
30,00 €  TTC Bases no 446 Avril 2026
Bases no 445 Mars 2026
30,00 €  TTC Bases no 445 Mars 2026
Bases no 444 Février 2026
30,00 €  TTC Bases no 444 Février 2026
Bases no 443 Janvier 2026
30,00 €  TTC Bases no 443 Janvier 2026
Bases no 442 Decembre 2025
30,00 €  TTC Bases no 442 Decembre 2025
bases_no_441_sommaire
30,00 €  TTC Bases no 441 Novembre 2025
bases_no_440_sommaire
30,00 €  TTC Bases no 440 Octobre 2025
bases_no_439_sommaire
30,00 €  TTC Bases no 439 Septembre 2025
bases_no_438_sommaire_1
30,00 €  TTC Bases no 438 Juillet-Août 2025
bases_no_437_sommaire
30,00 €  TTC Bases no 437 Juin 2025
Bases no 436  Mai 2025
30,00 €  TTC Bases no 436 Mai 2025
Bases no 435 Avril 2025
30,00 €  TTC Bases no 435 Avril 2025
bases_434_summary
30,00 €  TTC Bases no 434 Mars 2025
bases_433_sommaire
30,00 €  TTC Bases no 433 Février 2025
bases_no__432_summary
30,00 €  TTC Bases no 432 Janvier 2025
sommaires_bases_net_2024_december
30,00 €  TTC Bases no 431 Décembre 2024
bases_no__430_summary
30,00 €  TTC Bases no 430 Novembre 2024
sommaire_bases_429
30,00 €  TTC Bases no 429 Octobre 2024
sommaire_bases_428_1369992965
30,00 €  TTC Bases no 428 Septembre 2024
bases_427
30,00 €  TTC Bases no 427 Juillet Août 2024
© 2026 BASES PUBLICATIONS Tous droits réservés
  • Mot de passe perdu ?
  • Identifiant perdu ?
  • Créer un compte
  • Accueil
    • Présentation générale
    • Conditions d'utilisation
    • Mentions légales
    • FAQ - Questions fréquentes
    • Nous contacter
    • Support technique
  • Nos Publications
    • Lire nos articles de Bases
    • Lire Bases en format PDF
    • Lire nos articles de Netsources
    • Lire Netsources en format PDF
    • Lire nos Brèves de veille (gratuit)
    • Rechercher dans les articles
  • Fiches pratiques
  • Tags
  • S'abonner
    • Bases - Format Web
    • Bases - Format Papier
    • Netsources - Format Web
    • Netsources - Format Papier
    • Bases & Netsources - Format Web
    • Bases & Netsources - Format Papier
  • Acheter
    • Numéros de Bases
    • Numéros de Netsources
    • Nos fiches pratiques
    • Articles de Bases
    • Articles de Netsources
    • Rechercher un produit