Passer au contenu

Les filtres de messagerie en quête de sens

Des premières expériences chez les éditeurs couplent logiciels de filtrage de messages et moteur d’analyse sémantique.

Les filtres de messagerie ne représentent pas encore une assurance tous risques. Ces outils se font pourtant fort de traduire la politique de sécurité de l’entreprise au niveau des courriers électroniques. Tant qu’il s’agit de bloquer des messages en fonction de leur taille, de l’identité des émetteurs et destinataires ou de la nature des pièces jointes, ils s’acquittent correctement de leur tâche. Ils sont, en revanche, vite pris en défaut quand ils doivent interpréter le contenu du message.Certains éditeurs, comme Content Technologies (repris par Baltimore) ou Symantec, tentent de faire évoluer leurs technologies à base de mots-clés. D’autres préfèrent s’associer avec des professionnels de l’analyse sémantique. C’est le cas de Mailwatcher, qui mène actuellement une expérience avec le spécialiste français Sinequa.

Analyser jusqu’à 20 000 e-mails par jour

Au c?”ur de la solution de Sinequa, on trouve un moteur d’analyse sémantique se basant sur l’exemple. Il est déjà incorporé dans un logiciel de sécurité tiers, destiné à contrôler les visites sur le web. La messagerie soulève toutefois de nouvelles difficultés, comme “la variété des formats des pièces jointes”, reconnaît Philippe Laval, PDG de Sinequa. Il pointe également le langage utilisé dans les e-mails : “Mal écrit, regorgeant d’abréviations.”Lorsque ces deux défis auront été surmontés, il restera à résoudre celui du volume de messages à traiter par les moteurs d’analyse sémantique. “Aujourd’hui, on route 300 Mo de texte sur un Pentium ordinaire”, indique Philippe Laval. C’est insuffisant pour analyser l’ensemble des courriers électroniques qui transitent dans les grandes entreprises. En effet, “elles échangent jusqu’à vingt mille e-mails par jour”, confirme Vincent Hamaimi, ingénieur avant-vente chez Baltimore.L’analyse sémantique devrait intervenir en second rideau après une première sélection effectuée, par exemple, selon des critères d’identité. Techniquement, le moteur d’analyse sémantique ne traite le message que lorsque celui-ci a été nettoyé de l’ensemble de ses attributs de mise en forme. Il l’étiquette alors “sémantiquement” et renvoie son verdict au format XML. A charge, pour le filtre de messagerie, d’appliquer ensuite la bonne règle.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Olivier Roberget