Passer au contenu

Google présente Translatotron, le premier outil de traduction directe de la parole

Ce modèle permet de traduire une langue dans une autre en conservant la voix et le rythme du locuteur initial, le tout sans passer par une transcription écrite.

Google vient de présenter Translatotron, un modèle capable de traduire directement le discours parlé d’une langue à une autre. La solution de synthèse vocale de l’outil de traduction reproduit non seulement celle du locuteur mais aussi sa cadence. C’est ce que Google appelle de la « traduction directe ».

Translatotron prend une entrée vocale, la traite comme un spectrogramme – une représentation visuelle des fréquences – et génère un nouveau spectrogramme dans une langue cible. Le résultat est une traduction beaucoup plus rapide avec moins de risques d’erreurs.

Ne plus passer par l’écrit

Des systèmes de traduction de parole à parole existaient déjà par le passé. Mais ils transcrivaient le discours en texte pour le traduire, puis généraient une voix de synthèse pour lire le résultat. Le problème, c’est que ces différentes étapes étaient sources d’erreur et ralentissaient la vitesse d’exécution. Le résultat de Google Translatotron est encore un peu robotique et loin d’être parfait mais il représente un vrai progrès et devrait profiter à terme à Google Translate.

Source : blog intelligence artificielle de Google

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera

Amélie CHARNAY