Les habitudes de recherche

L'intelligence artificielle de Google
Google Rankbrain


Lorsque vous effectuez une recherche sur le web, Google conserve en mémoire vos requêtes et les sites que vous visitez. Il s'en sert notamment pour vous proposer de la publicité qui est en rapport avoir vos centres d'intérêt. Lors de vos recherches ultérieures, les sites que vous avez déjà visité sont gratifiés d'un bonus et apparaissent en meilleure position dans les pages de résultats par rapport à la même recherche qui aurait été effectuée depuis un autre appareil.

L'algorithme de Google est doté d'une intelligence artificielle qui accumule des données sur vous dans le but d'apprendre à vous fournir de meilleurs résultats au fur et à mesure de vos recherches. On peut donc imaginer que plus un internaute utilisera le moteur de recherche Google et meilleurs seront les réponses à ses requêtes. En effet, la même requête effectuée dans la même ville par deux personnes différentes ne donnera pas forcément le même classement.

Cet aspect de l'algorithme de Google peut être à double tranchant. En effet, si vous êtes habitué à visiter un certain type de sites on peut supposer que Google cherche à vous présenter en priorité ces types de sites que vous affectionnez. Mais si, pour une requête particulière, les résultats que vous attendez ne sont pas censé correspondre à vos habitudes, on peut imaginez que les résultats seront faussés car Google cherchera à vous présenter des sites correspondant à vos habitudes de recherches.

Quelques exemples : un internaute qui affectionne particulièrement les blogs se verra présenté plus de pages de bloggers dans les réponses à ses requêtes. Un internaute intéressé par des vidéos aura plus de chance de trouver des sites qui en proposent lors de ses recherches. 

Recherches fréquentes

Les requêtes fréquentes

Lorsque vous commencez à écrire votre requête, aussitôt Google vous propose une liste de requêtes fréquemment utilisées par les internautes et qui semblent correspondre à ce que vous cherchez. C'est une aide à la fois pour vous faire gagner du temps mais aussi pour vous permettre de formuler une requête correctement (bien orthographiée et avec les bons mots clés). vous aurez une plus grande chance de découvrir des résultats qui vous conviennent en utilisant une requête fréquemment demandée par les autres internautes. C'est aussi une aide pour Google pour comprendre ce que vous cherchez exactement. Dans la figure qui suit on voit que si on cherche les résultats de la coupe de France Google comprendra bien mieux la requête si on clique sur la quatrième proposition et il sera plus à même de nous proposer des réponses correspondant aux résultats de la Coupe de France plutôt que les résultats du Championnat ou de la Coupe du Monde.

Recherches pre-remplies
Exemple de recherche pre-remplie

Une requête demandée pour la première fois représentera un risque quant aux résultats proposés. Mais c'est ensuite en fonction des liens qui sont cliqués par les internautes que Google peut affiner ses résultats. Supposons qu'une requête soit demandée 10 fois et à chaque fois un lien proposé en première page n'est jamais cliqué. Google peut en déduire que ce lien ne correspond pas à ce que recherchent les internautes ayant tapé cette requête. Petit à petit, la position de ce lien dans les pages de résultats va chuter afin de laisser la place à des pages plus pertinentes par rapport à la demande.

Rankbrain : l'intelligence artificielle

Les chiffres nous apprennent que chaque jour, 15% des requêtes saisies par les internautes sont des requêtes totalement nouvelles qui n'ont encore jamais été formulées par personne par le passé. Pour ces requêtes, Google ne dispose donc pas d'un historique et d'une base de connaissance. C'est là qu'intervient un nouvel algorithme mis en place en 2015. Il est dénommé « Rankbrain » et ce n'est ni plus ni moins qu'un algorithme d'Intelligence Artificielle (IA) doté de facultés de « machine learning ». Cette définition barbare caractérise le comportement d'une machine capable d'apprendre en fonctionnant. Plus Rankbrain fonctionne et plus il s'améliore.

Le principe de Rankbrain est basé sur un système de réseau neuronal. Un réseau neuronal s'inspire du fonctionnement des neurones humains. Le système s'auto-corrige et complète au fil du temps l'information apprise. Rankbrain cherche à comprendre la signification d'une requête en se basant notamment sur des synonymes ou des recherches similaires. Là où un humain devinerait correctement le sens d'une requête à 70 %, Rankbrain affiche déjà des taux de 80%. En quelques mois d'existence, Rankbrain est déjà devenu le troisième algorithme le plus important contribuant à la pertinence d'un résultat. Mais notez que pour l'instant Rankbrain n'est qu'un critère parmi d'autres pour le calcul final du positionnement d'un site. Mais il y a de fortes chances pour qu'il prenne une place de plus en plus grande et se généralise dans le futur. L'intelligence Artificielle de Google est déjà présente dans ses voitures sans conducteur.

Les principes d'un réseau neuronal :
1) Le système apprend que les feux tricolorent règlent la circulation à un carrefour
2) Le système se complète et apprend que les voitures peuvent passer au feu vert
3) Le système se complète et son expérience lui fait comprendre qu'il est interdit d'avancer quand le feu est rouge
4) Le système en déduit lui-même qu'il faut s'arrêter quand le feu est à l'orange
5) Le système enregistre chaque cas particulier auquel il est confronté, il gagne en expérience et en anticipation, il s'améliore continuellement par le simple fait de fonctionner.