Passer au contenu

Microsoft : son intelligence artificielle sait désormais vous écouter… et vous couper la parole

Les chatbots ou assistants personnels maîtrisent péniblement les rudiments d’une discussion à sens unique. Les chercheurs de Microsoft ont réussi à atteindre une sorte de Graal, la capacité pour une IA de mener une conversation presque naturellement.

L’Art de la conversation est français, c’est entendu, mais dans le futur il est fort probable que Microsoft s’invite dans les « derniers salons où on cause ». Le géant américain vient en effet de publier un document où il fait part des derniers progrès de son intelligence artificielle dans le domaine de la conversation naturelle. En l’occurrence, c’est son chatbot chinois Xiaolce qui vient de franchir un nouveau cap.

Le full duplex, avenir de la communication

Le post explique que quand nous interagissons avec un assistant personnel numérique ou un chatbot aujourd’hui, l’expérience est plus proche d’une discussion tenue grâce à un talkie-walkie ou par messagerie instantanée que de celle d’une vraie conversation. Quand on parle avec quelqu’un, au téléphone, l’interaction est beaucoup plus dynamique. On complète une phrase, coupe la parole pour relancer son interlocuteur, anticipe un silence, etc. 

C’est ce niveau d’interactivité que les chercheurs de Microsoft pensent avoir atteint avec la nouvelle version de Xiaolce, déjà utilisé par 200 millions de personnes en Asie. Ce grand progrès se résume à une formule, le « full duplex », où la capacité de communiquer dans les deux sens de manière simultanée. Autrement dit, la possibilité pour le bot d’écouter ce qui est dit tout en parlant.

Pour y arriver, il faut que l’intelligence artificielle qui l’anime soit capable non seulement de savoir ce que vous dites mais également de prédire là où vous allez en venir. Elle peut alors préparer une réponse ou savoir quand vous interrompre pour répondre plus rapidement à une demande. Elle peut aussi profiter d’un silence pour poser une question qui précisera un point soulevé.

« Cela accélère vraiment le temps de réponse afin que tout semble plus naturel », explique Ying Wang, directrice chargée de la supervision de Zo au sein de Microsoft. Autre élément qui rend la conversation beaucoup plus fluide et agréable, il n’est plus nécessaire d’utiliser une formule d’activation de l’assistant avant chaque interaction.

« Tu peux me passer l’sel ? »

Mieux, Xiaolce a également appris à gérer deux tâches en même temps. Ainsi, imaginons que l’assistant vous raconte une histoire. Il s’arrêtera pour allumer une lumière comme vous le lui avez demandé avant de reprendre ce qu’il faisait comme si de rien n’était, comme le ferait un interlocuteur humain.

A court terme, ce grand pas en avant pourrait également être intégré à d’autres bots de Microsoft, dont Zo, aux Etats-Unis. A plus ou moins long terme, on pourrait imaginer que Cortana devienne une interlocutrice plus agréable à fréquenter entre deux rappels de rendez-vous et une recherche sur le Web.

Source :
Blog Intelligence Artificielle de Microsoft

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Pierre FONTAINE