Passer au contenu

Janet Baker (Dragon Software) : “La voix est la bonne voie pour le futur”

Pionnière de la reconnaissance vocale et cofondatrice de Dragon Software avec son mari Jim, Janet Baker pense que la voix aura un impact aussi important que la souris il y a vingt-cinq ans parce qu’elle améliore la productivité des individus.

01 Informatique : Pourquoi la reconnaissance vocale ?

Janet M. Baker : La reconnaissance vocale fut un choix délibéré que Jim et moi avons fait il y a trente ans. Nous avions aussi envisagé le traitement de l’image… Nous avons choisi la voix parce que cest un problème majeur, dont la solution est l’oeuvre dune vie. C’est très complexe et porte un énorme potentiel de valeur ajoutée. L’écriture à la main atteint vingt mots par minute, la frappe au clavier va jusqu’à quarante et la voix permet d’atteindre de cent à cent soixante mots par minute… Nous avons engagé tous ce que nous possédions pour créer Dragon en 1982, après avoir quitté les laboratoires dIBM, puis de Verbex, filiale dExxon, qui avait voulu se lancer dans ce domaine. Personne ne pensait alors que la reconnaissance vocale puisse avoir un avenir en dehors des laboratoires.Que représente aujourdhui Dragon Software sur le marché de la reconnaissance vocale ?Nous sommes en tête sur ce marché. Selon PC Data, nous détenons près de 60 % du marché américain, loin devant IBM et L&H… Nous sommes le treizième vendeur de logiciel en nombre d’unités et le sixième en valeur, selon l’enquête mensuelle de PC Data. Dragon fut le pionnier à plusieurs points de vue. Dabord, Jim a été le premier à appliquer les modèles cachés de Markoff (Hidden Markoff Models ou HMM) à la reconnaissance vocale. Puis nous avons développé le premier algorithme pour le microprocesseur 6502 fonctionnant à 1 MHz, et notre premier produit vendu en OEM comportait un vocabulaire de seize mots reconnus en temps réel.Notre premier gros client fut Apricot, société anglaise qui proposait notre logiciel sur un PC portable. Ensuite, IBM nous a licencié pour une carte vocale… En 1990, nous avons présenté le premier logiciel de reconnaissance discrète pour un vocabulaire étendu. Enfin, en avril 1997, nous avons annoncé Naturally Speaking, le premier logiciel de reconnaissance de la parole en continu avec un vocabulaire de deux cent trente mille mots. Personne d’autre à l’époque ne savait faire de la dictée vocale en continu…La reconnaissance vocale est-elle viable sur un marché de masse ?La parole va permettre douvrir une nouvelle ère. Jim et moi le pensions déjà pendant nos études à Carnegie Mellon. Cest une technologie qui va provoquer ce que Andy Groove appelle une inflexion stratégique. La puissance des processeurs offre aujourdhui assez de ressources pour gérer la reconnaissance vocale aussi facilement qu’un traitement de texte classique. Cette technologie est déjà très couramment utilisée dans certains secteurs tels que la médecine ou le juridique. Et, au-delà du PC, elle va se diffuser très vite comme une interface privilégiée dans tous les appareils portables pour lesquels le clavier n’est pas adapté ou l’est mal.Quel est l’avenir de Dragon ?Nous sommes une société de technologie, et non pas un développeur d’applications. Nous poursuivons trois objectifs :concevoir des algorithmes nouveaux pour accroître la précision par exemple, pour travailler dans des environnements bruyants ou être plus indépendant du locuteur ; enfouir la reconnaissance vocale dans des plates-formes plus petites et portables ; et, enfin, faire fonctionner les applications qui ont besoin de la voix.L’exemple le plus marquant est le Dragon Speaking Mobile, un petit magnétophone qui enregistre jusqu’à quarante minutes de parole en continu et qui, ensuite, connecté à un PC, transfère, reconnaît et stocke le texte automatiquement… Nous en avons vendu plus de six cent mille sur AOL en huit mois. Nous allons vers des secteurs où nous avons une supériorité technologique :la téléphonie, l’informatique enfouie, les systèmes professionnels de haut de gamme comme les centres d’appel, le datamining, la recherche d’archives. Bref, tous les secteurs où la voix permet d’importants gains de productivité.Vous vouliez entrer en Bourse au début de l’année. Pourquoi avez-vous retiré votre demande ?Tout simplement parce que de grands groupes nous ont proposé dentrer dans notre capital au moment même où nous voulions passer en Bourse… Nous avons donc décidé de tout reporter jusquà la fin de lannée .

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Alain Baritault