Passer au contenu

Quel moteur d’indexation pour votre entreprise ?

Selon IDC, les cadres consacrent la moitié de leur temps à chercher de l’information. En organisant les données autour d’un intranet, les moteurs d’indexation réduisent le coût de ces recherches. Quatre outils sont passés au crible par notre laboratoire.

Perte de temps, recherches redondantes, documents égarés, etc., le stockage informatique évite de nombreux tracas, mais pose des problèmes d’organisation des données archivées. Afin de faciliter cette tâche, les moteurs d’indexation répertorient la base de connaissances de l’entreprise de façon à simplifier la recherche d’information. Notre laboratoire a évalué les performances de quatre outils : K2 version 3.1 US (Verity), SearchServer 5.0 US (Hummingbird), RetrievalWare 6.9 US (Convera) et SharePoint Portal Server 2001 (Microsoft). Bien que sélectionné pour être testé, Autonomy Server ne nous est jamais parvenu, d’où son absence dans ce banc d’essai.

Verity K2, un outil complet et performant

À l’issue des tests, il apparaît que les opérateurs de recherche de Verity offrent le paramétrage le plus complet, tandis que Hummingbird se révèle être le plus rapide lors de la consultation du moteur. De son côté, Convera bénéficie de la plus grande richesse de formats indexés. Enfin, l’outil de Microsoft se montre le plus rapide dans les tâches d’indexation. Au final, K2 de Verity termine en tête de ce comparatif, tous domaines confondus. Il dispose de toutes les fonctions indispensables à un moteur d’indexation et ses résultats s’avèrent très corrects, en termes de performances, quant à la rapidité de consultation et la richesse des opérateurs pour les requêtes. Seul bémol, son exploitation en ligne de commande se révèle peu ergonomique, sans pour autant nuire à sa richesse fonctionnelle. Nous adressons également une mention toute particulière à RetrievalWare 6.9, qui se distingue par la quantité et la qualité des systèmes de filtres utilisés pour reconnaître les différents formats de fichiers. Une performance liée à son architecture AFM (Active Filter Module), spécialement conçue pour gérer une multitude de formats de fichiers. À l’inverse, SharePoint Portal Server 2001 se révèle des plus limités. Ses performances dépendent un peu trop des filtres développés (ou non) par les différents éditeurs de logiciels, et le moteur n’indexe que les fichiers associés à la suite Office.

pertinence des résultats et vitesse d’indexation : des critères clés

En ce qui concerne les performances globales, ces moteurs d’indexation auraient pu obtenir de meilleurs résultats. Mais nous avons demandé à chaque éditeur de paramétrer au mieux leur produit par rapport aux besoins spécifiques du banc d’essai. Il faut savoir que la mise en place d’un tel outil nécessite une longue phase de test, durant laquelle les paramétrages sont légion. Une fois l’optimisation terminée, nous n’avons autorisé aucune retouche supplémentaire. Nous avons souhaité recréer au mieux les conditions réelles d’exploitation en entreprise. L’évaluation de la pertinence des résultats a été réalisée par un jury composé de trois documentalistes, de quatre journalistes et d’un ingénieur informatique. Jugés les plus pertinents, les résultats du moteur de Verity comportaient néanmoins beaucoup de déchets (réponses sans rapport avec le sujet de la recherche), un problème rencontré également avec l’outil de Microsoft. Avec une pertinence plutôt moyenne, Convera RetrievalWare tire sur ce point son épingle du jeu ; il y a un minimum de requêtes hors sujet. Quant à la vitesse d’indexation, elle reste assez ponctuelle et n’a souvent d’importance que lors de la première mise en service, au moment du recensement de toute la base documentaire. Le reste du temps, les indexations sont effectuées uniquement dans le cadre des mises à jour.

Des moteurs compatibles avec de nombreux formats de fichiers

Critère majeur, la richesse des formats indexés prend en compte ceux des messageries et des bases de données. Les autres types de formats sont quasiment toujours reconnus par défaut. À noter que les formats utilisés par la PAO, tels que XPress, Draw ou encore InDesign, ne sont pas gérés par ces moteurs. K2, SearchServer et RetrievalWare disposent d’un kit de développement destiné à enrichir la base de filtres avec des formats non reconnus.

Les modes d’indexation

Concernant la mise en ?”uvre et l’administration, notre laboratoire a considéré les différentes possibilités d’indexation, que ce soit de manière complète, incrémentale, planifiée ou en mode bulk. Ce dernier sert à créer un fichier d’analyse de données destiné à forcer l’indexation. Nous avons également tenu compte de la qualité de l’interface d’exploitation, de la lisibilité de l’affichage standard des résultats et de la richesse des opérateurs de recherche. Dans ce domaine, Verity K2 arrive premier, même s’il ne se révèle pas facile à mettre en ?”uvre. Moins complet, Convera RetrievalWare se place en deuxième position. Complexe au départ, ce produit gagne en simplicité grâce à de nombreux assistants et explications. Vient ensuite Fulcrum SearchServer, qui fournit des opérateurs de recherche moins performants que ceux des deux outils précédents. Enfin, SharePoint Portal Server 2001 souffre de la faiblesse de ses opérateurs et de l’absence de mode bulk. Vu leurs prix, ces quatre moteurs d’indexation, qui s’utilisent dans le cadre d’un intranet/extranet ou d’un portail, se destinent uniquement à des entreprises fortunées. Un positionnement élitiste qui mériterait d’être revu, car toutes les sociétés ayant pignon sur internet en ont cruellement besoin.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Sylvain Bontoux