Passer au contenu

Moteur polyglotte pour recherche multisource

Sur le modèle d’un Copernic, Xerox propose un moteur de recherche universel, tant au niveau des sources que des langues. L’utilisateur a alors accès à toutes les informations disponibles en un seul clic.

La dissémination des données au sein d’un intranet est un danger, contre lequel les entreprises essaient de se prémunir. L’informatique décisionnelle (secteur de la business intelligence), en pleine croissance, a dû se préoccuper de gérer cette nébuleuse de sources. La rationalisation de l’accès aux données ?”en les regroupant en un point central (le data warehouse)?” et le dé-ploiement d’intranets, puis de portails, apportent des solutions. Mais ils ne facilitent en rien la recherche d’informations pour l’utilisateur final. Pour cela, il a besoin d’un moteur de recherche et d’indexation, lien avec les sources d’information.En marge des moteurs d’indexation ?” ceux de Verity, d’Autonomy, de Convera, d’Hummingbird, ou encore de Microsoft ?”, le centre de recherche de Xerox, installé à Grenoble, spécialisé dans les travaux de linguistique et de gestion des connaissances, a creusé une autre voie. “Ces différents moteurs fonctionnent sur le mode de l’indexation. Il faut recenser la totalité des informations avant qu’ils ne puissent entrer en jeu. Ce qui nécessite un travail de mise à jour permanent”, explique Jacques Conan, chef de produit de la division Multilingual Knowledge Management Solutions (MKMS) de Xerox.

Des sources hétérogènes

Le moteur de recherche de Xerox, Ask Once, prend le parti de fédérer la recherche auprès de sources d’informations hétérogènes : des data warehouse, des bases de données (BDD) relationnelles, documentaires, des progiciels de gestion intégrés (PGI), des solutions de travail collaboratif (Lotus Notes ou MS Exchange), mais aussi des pages web classiques ou dynamiques (formulaires, pages générées en ASP, etc.) “L’outil est destiné à ceux qui ne connaissent pas la syntaxe correcte d’une requête en SQL [système de BDD relationnelles, ndlr] “, assure Anne-Sophie Dussaucy, responsable marketing opérationnel chez MKMS.Le moteur de recherche de Xerox assure un rôle de traduction de la demande d’un utilisateur. Ce dernier accède à Ask Once par un navigateur web classique. Une simple application web java permet la consultation. Il s’installe sur un serveur du réseau de l’entreprise, doublé d’un serveur web Apache. La formulation de la requête s’effectue en langage naturel, éventuellement doublé de l’usage d’opérateurs booléens (ET, OU, SANS). En outre, dans sa version 2, commercialisée depuis septembre, Ask Once devient multilingue. Il accepte les requêtes en français, anglais et allemand, comprend aussi les réponses en espagnol et italien, et peut les restituer dans la langue de la requête. Un lien dynamique applicatif (un wrapper) assure la connexion vers les sources d’information.“Cette passerelle permet la traduction de la requête de l’utilisateur en un langage compréhensible, supporté par la source interrogée”, précise Jacques Conan. La technologie des wrappers est le c?”ur du moteur de recherche. Il aura fallu, lors du développement, mettre au point ces passerelles pour une grande diversité de sources : bases de données (Oracle), solutions de gestions de contenus propriétaires (Documentum), solutions de partage de connaissance (Docushare), moteurs d’indexation ou encore PGI (SAP en tête). La solution Ask Once est livrée en standard avec 25 wrappers. “Par ailleurs, détaille Jacques Conan, nous disposons d’une bibliothèque de 100 wrappers sur commande, dont beaucoup sont sectorisés par branches d’activités.” Outre la capacité d’interroger des sources internes au réseau de l’entreprise, le moteur de recherche de Xerox autorise les requêtes sur le web. La recherche peut s’étendre soit auprès de moteurs de recherche généraux (Google, etc.), soit auprès des moteurs dédiés de portails ou de sites d’information. L’entreprise doit au préalable développer un wrapper pour le site visé via un outil, le Wrapper Designer, qui assure l’auto apprentissage des fonctionnalités et possibilités de recherches dudit site web.

Les sciences de la vie en tête

Par défaut, Ask Once inclut des wrappers pour divers sites d’information. Le domaine des sciences de la vie (pharmacie, médecine) constitue à ce jour l’essentiel de la clientèle de Xerox MKMS. Une situation qu’Anne-Sophie Dussaucy explique par l’importance de la réduction du cycle de mise sur le marché “qui implique un accès rapide à l’information, à la connaissance accumulée par l’entreprise”.On retrouve aussi des références dans la high tech ?” branche Recherche & Développement de France Telecom, Aérospatiale ?” et dans la banque. Consciente de maîtriser une expertise de la recherche d’informations multisource ?” acquise auprès du centre R & D de Xerox ?” la division MKMS a entrepris des discussions avec des éditeurs de portails. Ask Once pourrait prochainement être intégré dans le portail d’un des premiers éditeurs du marché français.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Dupont