Les moteurs de recherche classifient mieux leurs résultats
Les fonctionnalités des moteurs web se rapprochent de plus en plus des mécanismes par facette présents dans les outils que l'on trouve en entreprise.
Les faits
Début juin, Microsoft a remplacé son moteur de recherche web, Live Search, par Bing, disponible en version complète aux Etats-Unis. La version française ne bénéficie pas encore des fonctionnalités évoluées de filtrage des résultats pour guider l'internaute dans sa recherche.
L'analyse
Fini Live Search. Le moteur de recherche web de Microsoft s'appelle désormais Bing. Comme dans la plupart des moteurs actuels, l'internaute peut restreindre, a priori, sa requête aux images, vidéos, news, etc., mais il a en plus la possibilité d'affiner sa recherche en sélectionnant une sous-catégorie qui apparaît - parfois - dans un panneau latéral après la première requête. La requête “ Microsoft ” proposera ainsi les catégories “ products ”, “ online services ”, “ investor relations ”, etc. Mais lancer une requête sur un autre nom d'entreprise n'aboutira pas aux mêmes catégories.
Du côté de Google, la démarche est analogue. En mai, lors de sa conférence Searchology, de nouvelles options de recherche pour classer les résultats y ont été présentées. A la différence de Microsoft, toutes les catégories sont statiques. On peut sélectionner les résultats selon leur date, le type de la source… Ces fonctions sont proches de celles d'autres moteurs plus confidentiels, comme Exalead et ses “ termes associés ”. Elles ne sont pour l'instant disponibles que sur les versions américaines… et sont loin d'être infaillibles.
Mais ces mécanismes existent déjà dans les moteurs d'entreprise et sont surtout utilisés par les sites d'e-commerce pour guider les acheteurs. L'expérience utilisateur est assez proche des moteurs web, mais les techniques mises en œuvre sont très différentes. Un moteur web ne sait pas qui est l'internaute, ni ce qu'il cherche. En entreprise, les bases de données, le type des produits et des documents sont connus. Fabrice Lacroix, président d'Antidot, indique : “ Le moteur utilise des métadonnées récupérées ou générées par un moteur de catégorisation. Les facettes ne sont pas nécessairement liées à des outils sémantiques, l'information est générée au moment de l'indexation. ” Les catégories sont souvent prédéterminées : types de documents, langues, lieux, origines…
Rarement des catégories dynamiques
Dans l'outil de Polyspot, l'administrateur ajoute des rubriques selon les besoins. “ En plus des métadonnées, des mécanismes d'extraction d'entité sont utilisés pour la classification. Ils servent, par exemple, à repérer les noms d'entreprises ”, précise Olivier Lefassy, PDG de Polyspot. La recherche peut aussi être élargie à des mots connexes grâce à un thesaurus. Les catégories sont donc fixes, mais adaptées aux besoins puisque le périmètre des requêtes est connu. Sébastien Ricard, directeur associé de gPartner, et revendeur des solutions Google, assure ainsi que “ quasiment toutes les facettes sont statiques. En entreprise, seul Endeca les construit dynamiquement ”.
Même si la recherche par facette n'a pas vocation à être utilisée systématiquement, elle pourrait l'être bien plus qu'actuellement. Avec Google et Microsoft qui la proposent désormais, les utilisateurs seront plus enclins à l'utiliser dans l'univers professionnel.
2 questions ?8230; : Pierre Harand, directeur des services internet grand public de Microsoft France
Quand Bing sera-t-il disponible en France ?
“ Bing est d? disponible en version b?, et nous pr?yons de sortir la version compl? d'ici ?n an. La profondeur des recherches et le nombre de cat?ries sont pour l'instant plus ?v?sur le moteur am?cain. Les cat?ries sont g?r? par la technologie s?ntique de Powerset, rachet?ar Microsoft r?mment. La plus grande partie du processus est donc automatis? mais une validation humaine est effectu? ”
Pourquoi ne pas avoir choisi la technologie de votre moteur Fast ?
“ En entreprise, les bases de donn? sont restreintes et on conna?leur structure avant de lancer l'indexation. Sur le web, il faut manipuler de gros volumes de donn? non structur? Les probl?tiques sont oppos?. ”
publicité

nos newsletters
Abonnez-vous à Micro Hebdo : 4,90 €/mois
Abonnez-vous à l'Ordinateur Individuel : 3 €/mois
Abonnez-vous à SVM mac : 4 €/mois
Abonnez-vous à 01 Informatique : 19 €/mois











