Passer au contenu

Google installe un nouveau moteur sous le capot

Le moteur de recherche vient de lancer une nouvelle version de son index, Caffeine, qui répertorie les sites bien plus rapidement qu’auparavant.

Google vient juste de rénover une pièce essentielle de sa grande machinerie. Hier, mercredi 9 juin, la firme de Mountain View a révélé qu’elle avait terminé la mise en place de son nouvel index, Caffeine, en bêta depuis quelques mois. C’est un changement souterrain, invisible pour l’utilisateur, mais de grande importance pour la pertinence des résultats renvoyés. L’intérêt ? Proposer de nouvelles pages Web plus rapidement dans les résultats de recherche, en accélérant leur indexation.

Pour mesurer l’impact du changement, il faut au préalable se pencher sur la façon dont fonctionne un moteur de recherche. Pour servir ses résultats, Google se sert de robots logiciels, qui surfent de lien en lien pour indexer toutes les pages et les intégrer dans la gigantesque base de données qu’interrogent ensuite les internautes.

Avant Caffeine, cette base de données n’était pas mise à jour quotidiennement. « Notre ancien index avait plusieurs couches, dont certaines était rafraîchies à un rythme plus élevé que d’autres, la couche principale était mise à jour toutes les deux semaines. Pour rafraîchir une couche du vieil index, nous devions analyser le Web entier, ce qui signifiait un délai important entre le moment où nous découvrions une page et celui ou nous vous la livrions », explique Carrie Grime, ingénieur logiciel de Google, sur le blog officiel de la firme.

Elle est fraîche, ma page !

Voilà précisément ce que change Caffeine, calibré pour proposer des pages Web plus « fraîches » (de 50 %, selon Google) aux internautes. Pour cela, Google indexe les sites différemment : finies, les couches monolithiques mises à jour toutes les semaines ou toutes les deux semaines, le nouveau système analyse les pages et met à jour l’index en continu.

Si Google n’est pas très disert sur le fonctionnement de son nouveau bébé, secret industriel oblige, il n’a pas hésité à offrir de nombreux chiffres impressionnants, vu la quantité phénoménale de données que Caffeine doit traiter. « Chaque seconde, Caffeine traite des centaines de milliers de pages en parallèle », indique Carrie Grimes. Qui précise que « Caffeine récupère presque 100 millions de gigaoctets dans une base de données unique et ajoute de nouvelles informations à un rythme de centaines de milliers de gigaoctets par jour. Il vous faudrait 625 000 d’iPod de la plus grande capacité pour stocker autant d’informations. »

Caffeine est d’ores et déjà en fonction. N’hésitez part à nous faire part de vos commentaires si vous remarquez des changements notoires – notamment dans le classement des sites – dans vos résultats de recherche Google.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Eric Le Bourlout