Infom@gic est l'un des projets emblématiques du pôle de compétitivité de la région parisienne, Cap Digital. Il réunit 27 partenaires du monde de l'industrie et de la recherche. Avec un budget de 40 millions d'euros, il explore les technologies d'analyse et de recherche d'information au sens large (images, texte, son, base de données). Le 20 décembre 2007, les différents acteurs impliqués ont présenté quelques prototypes d'applications aux fonctions étonnantes.
La transcription de conversations
Présenté par la société Vecsys, le logiciel Callsurf permet de transcrire et d'indexer automatiquement les conversations téléphoniques. La lecture d'une séquence audio génère, en temps réel, la retranscription in extenso de la discussion, même lorsque les paroles se superposent.
Une ponctuation est ajoutée pour clarifier le sens des propos. Les textes sont ensuite passés dans une moulinette d'extraction et d'indexation, avec à la clé une classification automatique par thèmes.
Callsurf devrait trouver sa première application dans les centres de contact d'EDF, qui reçoivent 25 millions d'appels par an, l'objectif étant d'améliorer la relation client.
La navigation dans les séquences audiovisuelles
L'INA a fait la démonstration d'un nouvel outil de navigation permettant un meilleur accès à l'information contenue dans leurs très nombreuses séquences audiovisuelles. La plate-forme est capable d'extraire automatiquement certains types de moments d'une séquence : gros plans, changement de plans, fond musical, situations d'élocution, applaudissement, extrait cinématographique, etc. Ces filtres peuvent être combinés pour obtenir des requêtes plus complexes. Ainsi, une séquence d'interprétation musicale se caractérise par un gros plan et un fond musical. L'objectif de l'INA dans ce projet est de valoriser son patrimoine numérique.
L'exploitation des traces de navigation sur le Web
Le Laboratoire d'informatique de l'université Paris 6 (LIP6) a présenté un outil qui vise à améliorer l'utilisation des traces que laissent les internautes sur le Web. Ces traces génèrent énormément d'informations difficiles à exploiter (fichiers log volumineux).
Le prototype de LIP6 applique des algorithmes capables de filtrer et de classer ces informations pour en tirer quelque chose d'intelligible. Il a permis, par exemple, de classer automatiquement les visites sur un site dédié aux adolescents, en un certain nombre de parcours-types, aisément interprétables : les visites autour du thème de la grossesse, celles qui concernent le forum de discussion ou encore la sexualité.
Ces parcours sont représentés de manière graphique. A l'avenir, la solution devrait également intégrer une analyse sémantique.
![]() |
Cliquez ici pour agrandir l'image |
![]() |
Cliquez ici pour agrandir l'image |
![]() |
Cliquez ici pour agrandir l'image |