Passer au contenu

Google essaie de mieux cerner les requêtes des internautes

Le moteur tente de mieux comprendre ce que cherchent ses utilisateurs. Il leur propose dans 37 langues, dont le français, des associations supplémentaires en fonction de leur requête.

Le géant de l’Internet annonce sur son blog avoir modifié son moteur de recherche afin qu’il comprenne mieux les demandes des internautes. Désormais, Google propose dans ses résultats, en bas de la page, des associations de mots en fonction de la requête qui lui est faite.

« Nous déployons une nouvelle technologie qui comprend mieux les associations d’idées et les concepts liés à votre recherche. […] Nous sommes désormais capables de répondre juste à plus de demandes et de faire des suggestions plus pertinentes par rapport à ce que vous avez besoin de savoir », expliquent en ligne Ori Allon et Ken Wilder, deux responsables de l’équipe technique chargée d’améliorer la qualité des résultats de Google.

Ces améliorations sont disponibles dans 37 langues, dont le français. Ainsi, lorsque l’on tape « prix nobel », Google propose des associations complémentaires : « prix nobel de médecine », « Marie Curie », « Louis Pasteur », « prix Goncourt », etc. Une recherche sur « pouvoir d’achat », et le moteur suggère « pouvoir d’achat des fonctionnaires », « loi sur le pouvoir d’achat », « Sarkozy », etc.  Pour « où faire du tourisme en Guadeloupe », l’internaute se voit proposer « Marie-Galante », « Pointe-à-Pitre », « bungalows », « villas », etc.

La méthode des mots associés

Pour autant, ces améliorations ne permettent pas à proprement parler une recherche sémantique, comme on a pu le lire ici et là. « Google regarde dans son index les expressions qui sont le plus souvent associées à la requête tapée par l’internaute. Sa force est qu’au vu de la taille de son index, il se trompe rarement. Mais cette méthode est loin d’être nouvelle. Elle était déjà appliquée en 1998 par le moteur Alta Vista », tempère Boris Borzic, ingénieur au CNRS, responsable des plates-formes de veille et des moteurs de recherche.

A terme, la recherche sémantique appliquée aux moteurs devrait permettre aux internautes d’interroger ces derniers comme ils parlent « Je cherche à acquérir une voiture familiale d’occasion pour moins de 18 000 euros. Le kilométrage doit être inférieur à 60 000 km »  et leur fournir une réponse structurée à partir de plusieurs sources d’information. On en est encore loin. 

Objectif : la recherche en langage naturel

Le britannique True Knowledge, accessible en bêta publique, tente de répondre à des questions en langage naturel. Ainsi, quand on lui demande « qui est le président français ? » (en anglais), le moteur répond « Nicolas Sarkozy » après s’être assuré d’avoir compris ce que vous vouliez dire par « french president »« Le problème avec le langage naturel est que les réponses sont rarement pertinentes, commente Boris Borzic, la recherche lexicale est très difficile à faire, en particulier en français. »

Un avis que modère Jean-Marc Lazard, responsable des « Labs » d’Exalead, un moteur de recherche français. « Aujourd’hui, on sait structurer un certain nombre de bases d’informations. La réponse à une question simple posée en langage naturel fonctionne assez bien. Ce qui est compliqué, c’est d’ouvrir la requête sur une base de données comme le Web, où l’on trouve du “full text”, des articles de blog ou du contenu non textuel comme les photos ou les vidéos. Les machines doivent savoir extraire des données à partir de bases de connaissances et structurer ces informations pour les restituer. »

Certains moteurs américains comme Freebase tentent de créer une gigantesque base de connaissances commune structurée. Un Google du Web sémantique en quelque sorte, où le moteur serait capable d’extraire et d’interpréter les relations entre les données pour répondre directement à des requêtes sans renvoyer vers des documents que l’internaute doit analyser.

Pour Boris Borzic, la solution idéale « pourrait venir de la recherche booléenne [Google, NDLR] associée à des couches d’analyses sémantiques ou linguistiques ». Une solution sur laquelle travaille aujourd’hui l’acteur français de la recherche Exalead.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Hélène Puel