Passer au contenu

Albert allie analyse linguistique et requêtes par mots-clés

Le moteur d’indexation et de recherche Albert s’implante en France. Sa spécialité ? Les analyses d’énoncés, au service de requêtes basées sur les mots-clés.

Baptisé Albert, le moteur de recherche et d’indexation de la société suisse éponyme se distingue par des fonctions d’analyse linguistique proposées par le module Albert Meaning Interpreter (AMI). Un document indexé par cet outil fait l’objet d’analyse de syntagmes lexicaux, à l’aide d’un dictionnaire grammatical baptisé GMIL (Grammaire minimum indépendante des langues).Autrement dit, AMI repère les sujets, les verbes et les compléments d’une phrase, et affecte un poids plus important aux mots-clés présents dans ces énoncés. Des analyses complémentaires étoffent le dispositif : calcul de distances entre les lettres (pour repérer d’éventuelles erreurs de frappe) ou analyse phonétique grâce à un dictionnaire idoine. Quant à l’indexation, elle s’opère sur le mode classique du suivi de documents dans l’arborescence d’une base de données (crawler), lorsqu’Albert est déployé sur un site web (AMI Website Access).

Une indexation passive réservée aux intranets

Une autre voie plus originale est réservée au marché spécifique des intranets (AMI Enterprise Discovery). Dans ce cas, l’indexation, qualifiée de passive, reste subordonnée aux requêtes de l’utilisateur vers les bases de données de l’entreprise : un script SQL est alors chargé d’activer le moteur d’indexation. Pour l’internaute, effectuer une requête en utilisant Albert revient à taper des mots-clés, qui seront assemblés par simple logique booléenne. Une approche basique, très éloignée des formulations en langage naturel. Cependant, l’outil s’appuie sur les analyses linguistiques réalisées par AMI pour affiner la formulation de la requête, puis la restitution des documents renvoyés à l’utilisateur.Albert construit également des profils de navigation sur le LAN, un deuxième mécanisme d’amélioration de la pertinence qui prend en compte la fréquence d’utilisation du moteur par “l’intranaute “. Enfin, Albert indexe automatiquement les mots inconnus qui sont présents dans les résultats des requêtes.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Francisco Villacampa