Passer au contenu

Comme Google, Alibaba a conçu une IA capable de passer des coups de fil

Le géant chinois du e-commerce a réalisé une démonstration d’un assistant vocal appelant un client attendant une livraison. Ce système répondrait à des millions de demandes par jour.

Google travaille toujours sur Duplex, son intelligence artificielle capable de passer des coups de fil à votre place et qui doit être intégrée à Google Assistant. Mais il n’est plus le seul sur ce créneau. Au mois de mai dernier, Microsoft a dévoilé son bot Xiaoice. Et voilà maintenant que le géant du e-commerce Alibaba présente lui-aussi un assistant vocal capable de gérer les livraisons de sa société de logistique Cainiao. Lors d’une conférence sur l’apprentissage machine qui s’est tenue la semaine dernière à Montréal, le  MIT Technology Review a pu assister à une démonstration pré-enregistrée de cette IA.

Une démonstration qui intrigue

Durant l’appel, l’agent vocal demande à un client où il veut que son colis lui soit livré :

Agent : Bonjour, je suis l’assistant vocal de Cainiao. Je suis ..

Client : Bonjour

A : Oui, bonjour, la livraison de votre colis est prévue pour demain au 588 Culture West Road. Est-ce que cela vous convient ?

C : Qui êtes-vous ?

A : Je suis l’assistant vocal de Cainiao. J’aimerais confirmer votre livraison demain matin au 588 Culture West Road. Est-ce que c’est bon pour vous?

C : Je ne suis pas à la maison le matin.

A : Dans ce cas, avez-vous une autre adresse à utiliser?

À lire : Duplex : comment Google a créé une IA capable de mener une conversation naturelle

Au court de cette conversation, qui a duré moins de 30 secondes, l’agent aurait fait preuve de capacités plutôt sophistiquées pour une intelligence artificielle, selon la revue du MIT. Il a notamment réagi à l’interruption du client et a repris la conversation sans recommencer son discours du début.

L’appel ayant été pré-enregistré, il convient de rester prudent. La conversation a pu être améliorée au montage.

Une base de données gigantesque

Jin Rong, du laboratoire de technologie et d’intelligence artificielle d’Alibaba, a déclaré que l’agent répond déjà à des millions de demandes de clients par jour. Actuellement, il n’est utilisé que pour coordonner les livraisons de colis, mais il pourrait embrasser d’autres domaines. Cainiao recevrait en moyenne 50 000 appels au cours d’une journée type, et cinq fois plus lors de la fête des célibataires, le 11 novembre. Alibaba développe également un assistant dans les restaurants et les magasins bruyants, un avatar à forme humaine qui peut répondre aux questions sur ses produits, et un chatbot de négociation de prix, déjà utilisé par 20% des utilisateurs de la plate-forme de revente Xianyu.

À la base de tous ces systèmes, on trouve le même moteur de reconnaissance de la parole et de traitement du langage naturel appelé AliMe et développé en interne. Le plus gros avantage d’Alibaba dans ce domaine, c’est l’énorme richesse de données dont il dispose pour l’entraîner. Les assistants apprennent et s’améliorent ainsi plus rapidement. Et il est vrai que le marché chinois, avec sa population d’1,3 milliards de personnes, est sans commune mesure avec ce que l’on trouve en Europe ou aux Etats-Unis. Avec son milliard de colis à livrer par jour, Alibaba a tout intérêt à automatiser son service clientèle.

La stratégie de Google est totalement différente. Pour commencer,  Duplex fait l’objet d’un déploiement à toute petite échelle avec une poignée de possesseurs de Pixel aux Etats-Unis. Sans aller jusqu’à parler de transparence, de nouvelles vidéos filmées par de vrais utilisateurs ont été mises en ligne dont certaines publiées par le site Venture Beat. Et celle réalisée du point de vue d’un restaurant est assez impressionnante. On y entend l’IA parler avec une fluidité et un naturel confondants, proche du brio des démonstrations de la Google I/O du mois de mai dernier. Car ce qui fait la force de Google Duplex, c’est la qualité de rendu de la voix artificielle : elle est indiscernable de la voix d’un humain avec toutes ses hésitations, ses silences, ses différentes intonations, ses accents et ses petites disfluences verbales (comme « hummm », par exemple) qui permettent de comprendre que l’interlocuteur est toujours en ligne.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Amélie CHARNAY