Actualités Emploi Start-up Evénements 01 Avis d'expert Vidéos Indicateurs Distribution Telecharger Pro Livres blancs

Les moteurs de recherche classifient mieux leurs résultats

Les fonctionnalités des moteurs web se rapprochent de plus en plus des mécanismes par facette présents dans les outils que l'on trouve en entreprise.
envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Les faits

Début juin, Microsoft a remplacé son moteur de recherche web, Live Search, par Bing, disponible en version complète aux Etats-Unis. La version française ne bénéficie pas encore des fonctionnalités évoluées de filtrage des résultats pour guider l'internaute dans sa recherche.

L'analyse

Fini Live Search. Le moteur de recherche web de Microsoft s'appelle désormais Bing. Comme dans la plupart des moteurs actuels, l'internaute peut restreindre, a priori, sa requête aux images, vidéos, news, etc., mais il a en plus la possibilité d'affiner sa recherche en sélectionnant une sous-catégorie qui apparaît - parfois - dans un panneau latéral après la première requête. La requête “ Microsoft ” proposera ainsi les catégories “ products ”, “ online services ”, “ investor relations ”, etc. Mais lancer une requête sur un autre nom d'entreprise n'aboutira pas aux mêmes catégories.

Du côté de Google, la démarche est analogue. En mai, lors de sa conférence Searchology, de nouvelles options de recherche pour classer les résultats y ont été présentées. A la différence de Microsoft, toutes les catégories sont statiques. On peut sélectionner les résultats selon leur date, le type de la source… Ces fonctions sont proches de celles d'autres moteurs plus confidentiels, comme Exalead et ses “ termes associés ”. Elles ne sont pour l'instant disponibles que sur les versions américaines… et sont loin d'être infaillibles.

Mais ces mécanismes existent déjà dans les moteurs d'entreprise et sont surtout utilisés par les sites d'e-commerce pour guider les acheteurs. L'expérience utilisateur est assez proche des moteurs web, mais les techniques mises en œuvre sont très différentes. Un moteur web ne sait pas qui est l'internaute, ni ce qu'il cherche. En entreprise, les bases de données, le type des produits et des documents sont connus. Fabrice Lacroix, président d'Antidot, indique : “ Le moteur utilise des métadonnées récupérées ou générées par un moteur de catégorisation. Les facettes ne sont pas nécessairement liées à des outils sémantiques, l'information est générée au moment de l'indexation. ” Les catégories sont souvent prédéterminées : types de documents, langues, lieux, origines…

Rarement des catégories dynamiques

Dans l'outil de Polyspot, l'administrateur ajoute des rubriques selon les besoins. “ En plus des métadonnées, des mécanismes d'extraction d'entité sont utilisés pour la classification. Ils servent, par exemple, à repérer les noms d'entreprises ”, précise Olivier Lefassy, PDG de Polyspot. La recherche peut aussi être élargie à des mots connexes grâce à un thesaurus. Les catégories sont donc fixes, mais adaptées aux besoins puisque le périmètre des requêtes est connu. Sébastien Ricard, directeur associé de gPartner, et revendeur des solutions Google, assure ainsi que “ quasiment toutes les facettes sont statiques. En entreprise, seul Endeca les construit dynamiquement ”.

Même si la recherche par facette n'a pas vocation à être utilisée systématiquement, elle pourrait l'être bien plus qu'actuellement. Avec Google et Microsoft qui la proposent désormais, les utilisateurs seront plus enclins à l'utiliser dans l'univers professionnel.

2 questions à… : Pierre Harand, directeur des services internet grand public de Microsoft France

Quand Bing sera-t-il disponible en France ?

“ Bing est déjà disponible en version bêta, et nous prévoyons de sortir la version complète d'ici à un an. La profondeur des recherches et le nombre de catégories sont pour l'instant plus élevés sur le moteur américain. Les catégories sont générées par la technologie sémantique de Powerset, racheté par Microsoft récemment. La plus grande partie du processus est donc automatisée, mais une validation humaine est effectuée. ”

Pourquoi ne pas avoir choisi la technologie de votre moteur Fast ?

“ En entreprise, les bases de données sont restreintes et on connaît leur structure avant de lancer l'indexation. Sur le web, il faut manipuler de gros volumes de données non structurés. Les problématiques sont opposées. ”

publicité
à lire aussi
SUR LES MÊMES THÈMES
Un processeur 100 cœurs pour Linux
Dell et Juniper dans les réseaux pour centres informatiques
Les métiers de l'informatique évoluent au CA
Un marchand d'armes rachète BBN
Externalisation : les DSI français restent assez conservateurs
Microsoft ouvre le format .PST d'Outlook
Ubuntu 9.10, le plus cloud des Linux
Dassault Systèmes prend en main la division PLM d'IBM
Microsoft renforce son offre collaborative
“ L'informatique au doigt mais pas à l'œil ”
“ Contre mauvaise fortune, des brevets ”
Canal Plus virtualise en IP ses 12 centres d'appels
Concurrence accrue dans la déduplication
Les superutilisateurs sous haute surveillance
SAP Business Objects Explorer s'ouvre à tous les types de données
Le couteau suisse de la communication sans contact
Dans les labos
Richard Valenti (Groupe Generali) : “ six millions d'euros, premier gain chiffrable de notre rationalisation ”
Inop's favorise la rencontre entre petites SSII et grands comptes
Les vertus du mid-market pour qui le comprend
01Informatique
01 INFORMATIQUE
L'hebdo de référence des décideurs informatiques.
Micro Hebdo
MICRO HEBDO
L'hebdo qui vous simplifie la micro
et Internet.
L'Ordinateur Individuel
L'ORDINATEUR INDIVIDUEL
Le mensuel informatique qui vous informe et vous conseille.
Tous droits réservés © 1999 - 2009 Internext - 01net.