Les moteurs de recherche classifient mieux leurs résultats

Les fonctionnalités des moteurs web se rapprochent de plus en plus des mécanismes par facette présents dans les outils que l'on trouve en entreprise.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Les faits

Début juin, Microsoft a remplacé son moteur de recherche web, Live Search, par Bing, disponible en version complète aux Etats-Unis. La version française ne bénéficie pas encore des fonctionnalités évoluées de filtrage des résultats pour guider l'internaute dans sa recherche.

L'analyse

Fini Live Search. Le moteur de recherche web de Microsoft s'appelle désormais Bing. Comme dans la plupart des moteurs actuels, l'internaute peut restreindre, a priori, sa requête aux images, vidéos, news, etc., mais il a en plus la possibilité d'affiner sa recherche en sélectionnant une sous-catégorie qui apparaît - parfois - dans un panneau latéral après la première requête. La requête “ Microsoft ” proposera ainsi les catégories “ products ”, “ online services ”, “ investor relations ”, etc. Mais lancer une requête sur un autre nom d'entreprise n'aboutira pas aux mêmes catégories.

Du côté de Google, la démarche est analogue. En mai, lors de sa conférence Searchology, de nouvelles options de recherche pour classer les résultats y ont été présentées. A la différence de Microsoft, toutes les catégories sont statiques. On peut sélectionner les résultats selon leur date, le type de la source… Ces fonctions sont proches de celles d'autres moteurs plus confidentiels, comme Exalead et ses “ termes associés ”. Elles ne sont pour l'instant disponibles que sur les versions américaines… et sont loin d'être infaillibles.

Mais ces mécanismes existent déjà dans les moteurs d'entreprise et sont surtout utilisés par les sites d'e-commerce pour guider les acheteurs. L'expérience utilisateur est assez proche des moteurs web, mais les techniques mises en œuvre sont très différentes. Un moteur web ne sait pas qui est l'internaute, ni ce qu'il cherche. En entreprise, les bases de données, le type des produits et des documents sont connus. Fabrice Lacroix, président d'Antidot, indique : “ Le moteur utilise des métadonnées récupérées ou générées par un moteur de catégorisation. Les facettes ne sont pas nécessairement liées à des outils sémantiques, l'information est générée au moment de l'indexation. ” Les catégories sont souvent prédéterminées : types de documents, langues, lieux, origines…

Rarement des catégories dynamiques

Dans l'outil de Polyspot, l'administrateur ajoute des rubriques selon les besoins. “ En plus des métadonnées, des mécanismes d'extraction d'entité sont utilisés pour la classification. Ils servent, par exemple, à repérer les noms d'entreprises ”, précise Olivier Lefassy, PDG de Polyspot. La recherche peut aussi être élargie à des mots connexes grâce à un thesaurus. Les catégories sont donc fixes, mais adaptées aux besoins puisque le périmètre des requêtes est connu. Sébastien Ricard, directeur associé de gPartner, et revendeur des solutions Google, assure ainsi que “ quasiment toutes les facettes sont statiques. En entreprise, seul Endeca les construit dynamiquement ”.

Même si la recherche par facette n'a pas vocation à être utilisée systématiquement, elle pourrait l'être bien plus qu'actuellement. Avec Google et Microsoft qui la proposent désormais, les utilisateurs seront plus enclins à l'utiliser dans l'univers professionnel.

2 questions à… : Pierre Harand, directeur des services internet grand public de Microsoft France

Quand Bing sera-t-il disponible en France ?

“ Bing est déjà disponible en version bêta, et nous prévoyons de sortir la version complète d'ici à un an. La profondeur des recherches et le nombre de catégories sont pour l'instant plus élevés sur le moteur américain. Les catégories sont générées par la technologie sémantique de Powerset, racheté par Microsoft récemment. La plus grande partie du processus est donc automatisée, mais une validation humaine est effectuée. ”

Pourquoi ne pas avoir choisi la technologie de votre moteur Fast ?

“ En entreprise, les bases de données sont restreintes et on connaît leur structure avant de lancer l'indexation. Sur le web, il faut manipuler de gros volumes de données non structurés. Les problématiques sont opposées. ”

publicité
à lire aussi
SUR LES MÊMES THÈMES
La fibre optique peu accessible aux PME
Comment lutter contre le paradoxe des TIC
Voyage au cœur d'un futur centre de données
Le secteur IT progresse, mais peut mieux faire
Crever enfin le plafond de verre
Les SSII, des handicapées de l'insertion
Stagnation de carrière pour les salariés d'origine étrangère
Conserver son emploi, à défaut de se faire embaucher
Pléthore d'acteurs en faveur de l'égalité des chances
“ Une démarche d'autant plus positive qu'elle sera volontaire ”
La PME Transgene se dote d'un réseau redondant multisite
Apple améliore son OS serveur avec des fonctions collaboratives originales
Déduplication : réplication en cascade
Poste client : client léger à prix léger
NEC peaufine son offre haut de gamme de stations de travail
La solution de visibilité de Manhattan Associates se convertit à la cartographie
Un outil d'écoconception intégré destiné aux PME
Gestion de contenu : Eversuite accessible depuis un mobile
GRC : SugarCRM disponible en mode cloud
Une offre de location d'IPBX avec convergence fixe-mobile