











Début juin, Microsoft a remplacé son moteur de recherche web, Live Search, par Bing, disponible en version complète aux Etats-Unis. La version française ne bénéficie pas encore des fonctionnalités évoluées de filtrage des résultats pour guider l'internaute dans sa recherche.
Fini Live Search. Le moteur de recherche web de Microsoft s'appelle désormais Bing. Comme dans la plupart des moteurs actuels, l'internaute peut restreindre, a priori, sa requête aux images, vidéos, news, etc., mais il a en plus la possibilité d'affiner sa recherche en sélectionnant une sous-catégorie qui apparaît - parfois - dans un panneau latéral après la première requête. La requête “ Microsoft ” proposera ainsi les catégories “ products ”, “ online services ”, “ investor relations ”, etc. Mais lancer une requête sur un autre nom d'entreprise n'aboutira pas aux mêmes catégories.
Du côté de Google, la démarche est analogue. En mai, lors de sa conférence Searchology, de nouvelles options de recherche pour classer les résultats y ont été présentées. A la différence de Microsoft, toutes les catégories sont statiques. On peut sélectionner les résultats selon leur date, le type de la source… Ces fonctions sont proches de celles d'autres moteurs plus confidentiels, comme Exalead et ses “ termes associés ”. Elles ne sont pour l'instant disponibles que sur les versions américaines… et sont loin d'être infaillibles.
Mais ces mécanismes existent déjà dans les moteurs d'entreprise et sont surtout utilisés par les sites d'e-commerce pour guider les acheteurs. L'expérience utilisateur est assez proche des moteurs web, mais les techniques mises en œuvre sont très différentes. Un moteur web ne sait pas qui est l'internaute, ni ce qu'il cherche. En entreprise, les bases de données, le type des produits et des documents sont connus. Fabrice Lacroix, président d'Antidot, indique : “ Le moteur utilise des métadonnées récupérées ou générées par un moteur de catégorisation. Les facettes ne sont pas nécessairement liées à des outils sémantiques, l'information est générée au moment de l'indexation. ” Les catégories sont souvent prédéterminées : types de documents, langues, lieux, origines…
Dans l'outil de Polyspot, l'administrateur ajoute des rubriques selon les besoins. “ En plus des métadonnées, des mécanismes d'extraction d'entité sont utilisés pour la classification. Ils servent, par exemple, à repérer les noms d'entreprises ”, précise Olivier Lefassy, PDG de Polyspot. La recherche peut aussi être élargie à des mots connexes grâce à un thesaurus. Les catégories sont donc fixes, mais adaptées aux besoins puisque le périmètre des requêtes est connu. Sébastien Ricard, directeur associé de gPartner, et revendeur des solutions Google, assure ainsi que “ quasiment toutes les facettes sont statiques. En entreprise, seul Endeca les construit dynamiquement ”.
Même si la recherche par facette n'a pas vocation à être utilisée systématiquement, elle pourrait l'être bien plus qu'actuellement. Avec Google et Microsoft qui la proposent désormais, les utilisateurs seront plus enclins à l'utiliser dans l'univers professionnel.
Quand Bing sera-t-il disponible en France ?
“ Bing est déjà disponible en version bêta, et nous prévoyons de sortir la version complète d'ici à un an. La profondeur des recherches et le nombre de catégories sont pour l'instant plus élevés sur le moteur américain. Les catégories sont générées par la technologie sémantique de Powerset, racheté par Microsoft récemment. La plus grande partie du processus est donc automatisée, mais une validation humaine est effectuée. ”
Pourquoi ne pas avoir choisi la technologie de votre moteur Fast ?
“ En entreprise, les bases de données sont restreintes et on connaît leur structure avant de lancer l'indexation. Sur le web, il faut manipuler de gros volumes de données non structurés. Les problématiques sont opposées. ”
