Passer au contenu

Les sites portails vont donner de la voix

Marché en pleine explosion, la reconnaissance vocale pour des applications Internet est en phase de déploiement. Les développements sont encore très lourds.

Les fournisseurs de services sur Internet (ISP) cherchent de nouvelles fonctions pour se faire concurrence. Faire passer Internet ne suffit plus ! ‘, martèle Sami Al Fakir, responsable segment de marché entreprise chez Natural MicroSystems (NMS). Parmi ces fonctions, la navigation à la voix dans les portails Internet, auxquels il est possible d’accéder par le biais d’un téléphone (Wap ou RTC), a le vent en poupe. ‘ La technologie est déjà disponible, ajoute Sami Al Fakir, un déploiement massif sur le marché pourrait même être réalisé d’ici à un an. ‘

Optimiser les développements

Dans cette attente, le marché des ISP est prioritaire, avec un seul objectif : développer et déployer rapidement des solutions à commandes vocales. En soi, la méthode est simple : il s’agit de réunir une carte de communication CTI (fabriquée par Dialogic, NMS ou, depuis peu, par Digi), un moteur de reconnaissance vocale (édité par Nuance, Philips, IBM ou encore Lernaut et Hauspie) et un système IVR (Interactive Voice Re-cognition comme celui d’Edify) pour gérer l’ensemble. ‘ Le problème auquel sont confrontés les développeurs réside dans l’utilisation des API (NDLR : interfaces de programmation) propres à chaque composant, ex-plique Sami Al Fakir. Il faut donc adapter l’application à ces API, ce qui implique un travail considérable. Une ma-nière de simplifier cette tâche consiste à regrouper ces API en une seule, ce que nous avons fait en nous associant à Nuance pour produire Hearsay. ‘ Celui-ci comprend le moteur de Nuance 7.0 et une carte de communication NMS, l’AG 4000.

Un prix encore très élevé

Côté budget, la carte AG 4000 coûte 29 000 F (4 421 E) tandis que le moteur de reconnaissance vocale se chiffre à près de 10 000 F (1 524 E) par ligne téléphonique. Ce prix peut sembler élevé, mais Christian Dugast, directeur de Nuance Europe, le justifie : ‘ Nuance délivre le “reconnaisseur”, un système qui fonctionne indépendamment du locuteur. Ce n’est pas comme les systèmes de dictée personnelle : il n’y a pas ici de phase d’apprentissage. Et il ne s’agit pas non plus de retranscrire des mots. Notre système fait de l’interprétation en temps réel, il comprend le langage naturel. Dans le cadre des applications Internet, où nous travaillons avec près de 15 000 mots, le taux de reconnaissance atteint 97 %. ‘

Traduction et équilibrage de charge

Retranscrire le code HTML d’un site Internet en voice-XML n’est pas si simple. Les repères changent. Sur le Web, l’?”il est attiré par le mouvement ou les graphiques, et il est très naturel d’ignorer certaines informations pour aller de l’une à l’autre.
En téléphonie, c’est différent. Les informations sont données séquentiellement et l’on ne peut plus se reposer sur l’aspect graphique. Outre cette tâche de traduction, les kits de développement disposent de fonctions de développement de grammaire, de dialogues et d’analyse, mais aussi d’outils d’équilibrage de charge. Ces derniers facilitent la gestion des ressources des processeurs du serveur en tenant compte de l’occupation des lignes téléphoniques. nmss.com


nuance.com


edify.com

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Lionel Sarrès