Passer au contenu

La reconnaissance vocale au service de la recherche

Les laboratoires d’Exalead ont mis au point un moteur de recherche capable de détecter des mots-clés dans des contenus audio et vidéo.

http://voxaleadnews.labs.exalead.comTapez un mot, une phrase, le moteur de recherche Voxalead retrouve l’enregistrement vidéo ou audio dans lequel apparaît ce mot prononcé par les personnes interviewées ou dans le commentaire d’un reportage. Encore en phase de test, cette plate-forme est un pur produit issu des laboratoires du moteur de recherche français Exalead, développé au sein du projet européen Quaero. Ce moteur de recherche basé sur la reconnaissance vocale indexe les mots prononcés dans des vidéos, des radios, des programmes TV ou tout autre commentaire audio diffusé sur le Web. Il utilise la technologie de transcription automatique du LIMSI, le laboratoire de recherche du CNRS. Son champ d’action couvre les contenus en français, anglais, espagnol, mandarin, russe et arabe provenant essentiellement des chaînes d’information (BFM, France24, iTélé, LCI, Al-Jezira…) et les stations de radios (Europe 1). Les mots-clés sont repérés et surlignés dans la transcription écrite qui apparaît sous la vidéo. Encore faillible, le système commet parfois quelques erreurs dans la reconnaissance de mots lorsqu’ils sont mal prononcés (al-Qaeda est retranscrit phonétiquement par “ quelqu’un ”). Des petits problèmes que devrait régler le laboratoire au fil des tests.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Frédérique Crépin