Passer au contenu

La voix, bouée de sauvetage du Web

Alors que le WAP ne décolle pas, le Web vocal, avec le standard VoiceXML, est l’espoir des sites existants. Pivot des applications vocales sur le Web, VoiceXML n’en est encore qu’à sa première mouture, et les applications restent à inventer.

“Le Web vocal est la meilleure solution de remplacement face au Web mobile, qui continue de décevoir”, affirme, sûr de lui, Jérémie Dastain, président d’Ubitalk.Sa jeune start-up se présente comme la première agence Web spécialisée dans les applications vocales d’Internet. Des compétences similaires sont affichées par Dexem ou par la SSII strasbourgeoise Neurosoft. Alors que le WAP n’a toujours pas fait ses preuves, le Web vocal entend profiter de la simplicité du standard VoiceXML pour offrir aux sites existants un meilleur rendement de leur business model, en profitant des services Audiotel. En s’appuyant sur les infrastructures existantes, l’Internet vocal permet, en effet, de rentabiliser les investissements déjà réalisés sur un site, en apportant de nouvelles sources de revenus liées à la téléphonie et en autorisant des modèles basés sur la souscription d’abonnements.

Un accès simplifié à l’information

Bien sûr, les applications du Web vocal restent à inventer. Représentatif de cette nouvelle génération, le service Mobiquid autorise, grâce à la reconnaissance vocale, l’identification, à partir d’un mobile, d’une chanson diffusée à la radio. En appelant Mobiquid depuis un mobile, l’utilisateur entre en contact avec un serveur vocal qui lui demande le nom de la station écoutée. Si ce nom lui est inconnu, Mobiquid lui propose de monter le son de la radio, pour poursuivre la recherche. Pour accéder à ce service, il suffit de composer un numéro non surtaxé, où que l’on se trouve, 24 heures sur 24 et 7 jours sur 7. Par son intermédiaire, on peut ensuite acheter le CD grâce à un service de SMS acheminé par MobileWay. Cet exemple montre que la convergence du téléphone, du Web et des technologies vocales devrait faire exploser le marché, du moins lorsque les entreprises sauront délimiter les services proposés. “C’est la principale difficulté pour cette nouvelle génération d’applications “, estime Jérémie Dastain.L’ergonomie tient aussi une place importante dans ce dispositif. À ces fins, Ubitalk utilise des jingles musicaux ou des voix d’artistes et dispose d’un véritable studio de casting de la voix, tout en cultivant ses compétences techniques grâce à un partenariat avec le leader mondial de la reconnaissance vocale, Nuance Communications.Pour les entreprises, ces applications coûtent de 20 000 € à plusieurs centaines de milliers d’euros. Un investissement dont la rentabilité est à portée de main… puisqu’il y a, en théorie, plus de soixante-cinq millions de téléphones en France (1,7 milliard dans le monde). Cela explique l’engouement des six cents fournisseurs qui ont rejoint le VoiceXML Forum dans l’espoir de créer une masse suffisante pour faire décoller le marché. “La promotion du standard est capitale pour l’avenir des applications vocales “, estime Laurent Balaine, président de Telisma.BeVocal, General Magic, IBM, NetCentrex, Nuance, Philips, Speechworks, Telisma, ViaFone ou VoiceGenie sont quelques-uns des six cents acteurs du Forum. Leur credo ? L’Internet vocal simplifie l’accès à l’information, notamment si on le compare à des commandes à touches impliquant un dialogue lourd ?” de type arborescent. L’avantage est encore plus net en situation de mobilité, où les mains ne sont généralement pas libres, alors que les claviers ne cessent de se miniaturiser. Ainsi, contrairement au WAP, l’Internet vocal rend Internet réellement mobile. Il autorise l’accès à l’information, ou la réalisation de certaines transactions, sans contrainte de temps : louer une voiture, connaître le dépanneur le plus proche, appeler sans composer de numéro, consulter le cours des actions, se renseigner sur les retards ou les annulations de vols, ou réserver un billet de train.Déclinaison de XML (Extensible markup language) pour la voix, VoiceXML 1.0 propose aux concepteurs de sites Internet une syntaxe et une logique qui leur sont familières.

Outils et méthodologies à adapter

L’infrastructure d’un site Web existant peut être reprise afin d’y incruster du vocal. Langage réputé simple pour qui maîtrise HTML, VoiceXML définit un certain nombre de commandes permettant de décrire l’architecture d’un dialogue. Il libère le programmeur de la gestion des couches basses du couplage CTI.Celle-ci est directement prise en charge par l’interpréteur VoiceXML (Voice Gateway et Voice Browser). L’application vocale écrite sous la forme de pages VoiceXML peut alors être transmise à l’hébergeur du site. Le langage rend possible l’utilisation de messages préenregistrés et de technologies de reconnaissance et de synthèse vocales. Avec la version 1.0, la grammaire préchargée doit être compatible avec le moteur utilisé. Attendue fin 2002, la version 2.0 de VoiceXML offrira l’écriture d’un vocabulaire compréhensible par toute plate-forme directement dans les pages VoiceXML.Si une avancée est tangible du côté du langage, il en va autrement du côté des outils et des méthodologies… qui restent à inventer. La société de services Neurosoft espère bâtir autour de VoiceXML une méthodologie qui permette de concevoir et d’évaluer des portails vocaux avec des outils adaptés. Elle participe, avec le CNRS, IBM et Novadis, au projet Portail vocal d’entreprise (PVE), soutenu par le Réseau national de recherche en télécommunications.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Jo Cohen