01net. web avec Google
Actualité informatique
Test comparatif matériel informatique
Jeux vidéo
Astuces informatique
Vidéo
Télécharger
Services en ligne
Forum informatique
01men
01net Pro Entreprise informatique
Bureautique
Multimédia
Internet
Utilitaires
Personnaliser son pc
Loisirs
Sécurité
Logiciels Mobiles
Services en ligne
Divers

Mieux chercher sur Internet avec Google, Bing et WolframAlpha

Nouveaux systèmes d'analyse, nouvelles interfaces, ces derniers mois, l'actualité des moteurs de recherche a été riche. Voici ce qui a et ce qui va changer.

envoyer
par mail
imprimer
l'article
Sans eux, Internet ne serait qu'un immense jeu de piste sans vrai point de départ. Certes, il serait toujours possible de passer par des « portails », semblables en quelque sorte à des annuaires d'Internet. Mais ce serait tout de même fort inconfortable. Force est d'avouer que nous ne pouvons tout simplement plus nous passer des moteurs de recherche. Et, a fortiori, du plus grand d'entre eux, Google.
Quasi synonyme d'Internet, il est devenu pour plus de 95 % des Français et 90 % de la population mondiale, la porte d'entrée numéro un du Web. Il suffit de voir l'affolement qui s'empare de la Toile lorsque, pour un instant, Google a des ratés. Comme le 31 janvier 2009, lorsque le site a, pendant presque une heure, classé tous les sites comme potentiellement dangereux et bloqué les liens vers eux.
Aujourd'hui, Google est donc un réflexe : même s'ils connaissent l'adresse d'un site, les internautes ont l'habitude d'entrer son nom dans le moteur de recherche plutôt que de taper directement l'adresse dans le navigateur. Ne faites-vous pas ainsi pour consulter le site de la SNCF, par exemple ? Nous sommes habitués à la litanie des liens bleus qui s'affichent en réponse à nos recherches, et dont la présentation n'a guère changé depuis plus de dix ans, c'est-à-dire depuis le lancement de Google en 1998.

Une tout autre approche

Et pourtant… Le monde des moteurs de recherche s'agite ces derniers mois. De nouveaux acteurs font leur apparition. Tout d'abord, Microsoft, qui tente de récupérer quelques pourcentages de parts de marché qu'il n'a jamais réussi à obtenir avec son ancien moteur, Live Search. Mais également de nouveaux venus, plus étranges, comme WolframAlpha. D'autres également, comme Yahoo!, essayent de se repositionner.
Pour épauler leur propre moteur, ils tentent de révolutionner le concept même du moteur en se posant une question simple : les gens ont-ils vraiment envie de chercher quelque chose sur Internet ? Ou plutôt, lorsque les internautes effectuent des recherches sur le Net, cherchent-ils vraiment des sites ?
Microsoft répond clairement non. Pour le géant du logiciel, les gens veulent surtout des faits et qu'on les aide à prendre des décisions. Ils ne veulent que rarement trouver des sites. Chez Yahoo!, on exprime cela autrement en parlant de la « mort des dix liens bleus », ces dix liens qui représentent aujourd'hui la réponse classique à une recherche. Autrement dit, ce n'est pas chercher que les internautes veulent, mais trouver. Les réponses doivent donc être mieux adaptées, et d'emblée complètes. Lorsque vous entrez le nom de votre ville ainsi que le nom d'une autre ville, il y a de fortes chances pour que vous soyez en train de chercher les horaires des trains ou des avions. Ne serait-il pas malin de la part du moteur de recherche de vous afficher tout de suite ces informations ? Bienvenue dans le monde des « moteurs de décision », selon la terminologie choisie par Microsoft.
Autre grand changement en cours dans le domaine de la recherche, la poursuite de l'instantanéité : Internet est en perpétuel mouvement. Les informations y sont de plus en plus envoyées en temps réel, par le biais de systèmes comme Twitter, qui permet d'envoyer des commentaires de 140 caractères maximum. Bing, le moteur de Microsoft, vient de se mettre à indexer en direct les commentaires de personnalités, tandis que Google se prépare à les intégrer dans son moteur de recherche d'actualité.
Le chantier est loin d'être terminé, mais il donne un aperçu des changements à prévoir dans les mois à venir

Comment ça marche ?

Les moteurs de recherche sur Internet n'ont fait que reprendre des technologies éprouvées depuis les débuts de l'informatique : il s'agit ni plus ni moins de très grosses bases de données. Leur travail peut être décomposé en plusieurs étapes : ils commencent par collecter les informations. Cela veut dire, dans le cas d'Internet, récupérer toutes les pages de tous les sites. Ils suivent tous les liens qui se trouvent sur les pages trouvées, afin d'aller récupérer toujours plus de pages. Cette collecte est automatisée et effectuée par des programmes que l'on appelle des « robots ».

Les pages récupérées sont ensuite stockées sur des centaines de disques durs, dans des centres de données. Des programmes se chargent alors d'extraire les données des pages, de les « comprendre ». Les textes sont analysés, les liens sont répertoriés ainsi que les informations annexes (auteur de la page, adresse de la page, etc.). Toutes les données sont alors indexées, c'est-à-dire que les occurrences de chaque mot vont être comptées dans chaque page, et que le tout va être entré dans une base de données. Enfin, ces données sont classées. Un même mot peut se trouver en même temps sur des millions de pages différentes. Il faut donc effectuer un classement qui permettra de décider que, pour une requête donnée, tel site arrivera en premier et tel autre à la vingt-cinq millionième place…

La puissance et la renommée d'un moteur de recherche dépendent principalement de la qualité de son classement. Les formules utilisées par les uns et les autres pour effectuer ce classement sont gardées jalousement secrètes. La dernière étape est la plus simple : le site du moteur de recherche propose un champ de saisie et affiche, en réponse aux requêtes, la liste des liens les mieux classés. Mais attention, comme vous le verrez dans ce dossier, la donne est en train de changer fondamentalement, et la nature même du fonctionnement des moteurs de recherche est en passe d'être modifiée.

publicité