Passer au contenu

6 difficultés pour un formidable défi technologique

L’espoir des chercheurs : que le traitement numérique des témoignages sur la Shoah aboutisse à un système de reconnaissance vocale universel. Un défi des plus difficiles…

1. 116 000 heures de vidéo.

Transcrire manuellement ce volume exceptionnel de données représenterait un coût rédhibitoire en main-d’?”uvre et en temps. Même pour un logiciel de reconnaissance vocale, c’est un très gros travail !

2. 32 langues différentes.

Les témoins interviewés par la Fondation de la Shoah sont multilingues, utilisent parfois des dialectes rares, et passent souvent du yiddish à l’anglais ou à l’allemand.

3. De nombreux accents étrangers.

La plupart des personnes s’exprimant en anglais parlent avec un fort accent. Ainsi, 4 000 témoignages dans cette langue ont déjà été retranscrits manuellement par la Fondation de la Shoah.

4. Des voix altérées par l’âge et l’émotion.

Il s’agit du discours de personnes âgées, souvent déformé par l’émotion. Il s’ensuit une très grande variabilité du langage.

5. Des conditions d’enregistrement très variables.

Les témoignages ont été recueillis dans des contextes acoustiques très différents et à l’aide de matériels divers.

6. Des noms propres rares ou inconnus.

Les noms de personnes ou de lieux à reconnaître et à indexer n’appartiennent pas forcément à un champ lexical courant.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Elvira Velasco