Passer au contenu

Les filtres de messagerie en quête de sens

L’éditeur Mailwatcher expérimente le couplage de son logiciel de filtrage de messages avec le moteur d’analyse sémantique du français Sinequa.

Les filtres de messagerie ne représentent pas encore une assurance tous risques. Tant qu’il s’agit de bloquer des messages en fonction de leur taille, de l’identité des émetteurs et destinataires ou de la nature des pièces jointes, ils s’acquittent correctement de leur tâche. Ils sont, en revanche, vite pris en défaut quand ils doivent interpréter le contenu du message.Certains éditeurs, comme Content Technologies (repris par Baltimore) ou Symantec, tentent de faire évoluer leurs technologies à base de mots-clés ; d’autres préfèrent s’associer avec des professionnels de l’analyse sémantique. C’est le cas de Mailwatcher, qui mène actuellement une expérience avec le spécialiste français Sinequa.

Un langage difficile à décoder

Au c?”ur de la solution de Sinequa, on trouve un moteur d’analyse sémantique fondé sur l’exemple. Ce moteur est déjà incorporé dans un logiciel de sécurité tiers, destiné à contrôler les visites sur le Web. La messagerie soulève toutefois de nouvelles difficultés. “La variété des formats des pièces jointes est l’une d’elles “, reconnaît Philippe Laval, PDG de Sinequa. Il pointe également le langage utilisé dans les e-mails : “Mal écrit, regorgeant d’abréviations.”Lorsque ces deux défis auront été surmontés, les moteurs d’analyse sémantique seront confrontés au volume de messages à traiter. “Aujourd’hui, on route 300 Mo de texte sur un Pentium ordinaire “, indique Philippe Laval. C’est insuffisant pour analyser tous les courriers qui transitent dans les grandes entreprises.“Elles échangent jusqu’à 20 000 e-mails par jour “, confirme Vincent Hamaimi, ingénieur avant-vente chez Baltimore. L’analyse sémantique devrait intervenir en second rideau après une première sélection effectuée, par exemple, selon des critères d’identité.Techniquement, le moteur sémantique traite le message une fois nettoyé de ses attributs de mise en forme. Il lui accole une étiquette sémantique et renvoie son verdict en XML. A charge, pour le filtre de messagerie, d’appliquer ensuite la bonne règle.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Olivier Roberget