Les appels réalisés par Google Duplex étaient-ils factices ?

La question est posée par de nombreuses personnes ayant vu la présentation lors de la dernière conférence Google I/O et qui ne se sont pas arrêtées au côté impressionnant mais ont noté des détails troublants qui sèment un doute sur la véracité de ces appels.

Une démonstration bluffante

Google avait frappé très fort à l’occasion de sa conférence annuelle Google I/O. Sa technologie Duplex permet potentiellement à une intelligence artificielle (AI) de passer des coups de fil à notre place et ainsi de nous décharger de certaines tâches inutiles.

Pour nous convaincre du potentiel de sa technologie, on avait même eu le droit à une démonstration très complète menée par Sundar Pichai, le PDG de Google. Google Duplex pouvait recevoir vos instructions et passer ensuite un coup de fil à votre place. Surtout, loin d’être un processus automatisé, l’IA était capable de suivre les problèmes et les aléas d’une conversation avec un être humain. Bref, le résultat était particulièrement bluffant sur le papier et sur la vidéo.

Et peut-être même trop impressionnante

Dans un premier temps, on s’est focalisé sur un aspect presque anecdotique. Si Google Assistant allait s’identifier quand il passait les coups de fil à notre place. On dit presque mais savoir si on parle à un être humain ou une intelligence artificielle reste tout de même très important. On s’est dit alors que c’était sans doute le problème le plus important, un paramètre de plus à contrôler dans la guerre entre humains et machines qui se prépare selon Elon Musk.

Pourtant, le problème se trouvait peut-être ailleurs. La démonstration était-elle vraiment réelle ou le géant de Mountain View s’est-il un peu arrangé avec la réalité ? C’est la question posée par le site Axios. En effet, le nom du salon de coiffure ou du restaurant n’est jamais donné lors de l’appel. Et la façon de réagir de la personne au téléphone est surprenante. Pour le premier élément, cela pourrait être compréhensible pour ne pas donner trop d’attention à l’établissement.

Par contre, lorsque vous téléphonez à une entreprise, la personne qui répond donne son nom en général. Là, rien. Si l’on tend l’oreille, on n’entend absolument aucun bruit à l’arrière de la conversation, ce qui assez peu probable dans des lieux comme un salon de coiffure ou un restaurant dans lesquels il y a toujours une atmosphère ambiante.

Autre détail troublant, dans aucune des deux conversations, l’enseigne ne demande un nom et un numéro de téléphone pour les réservations, ce que ferait systématiquement ce type d’établissement. Axios a d’ailleurs appelé tous les salons de coiffure et les restaurants présents dans la ville et systématiquement, on note un bruit de fond, toutes les entreprises se présentent lors du décrochage du téléphone et toutes tentent d’obtenir un numéro pour rappeler en cas de retard du client.

Autant d’éléments qui sèment le doute sur la performance de Google, qui s’est d’ailleurs refusé à commenter les arguments d’Axios. De nombreux médias s’interrogent désormais, il va falloir réagir chez Google, sous peine de voir sa présentation discréditée, surtout si quelqu’un démontre finalement que les conversations étaient fausses ce qui serait un comble pour une entreprise disant lutter contre les fake news…


13 commentaires

  1. Emmanuel Ghesquier le

    Ce n’est pas juste le nom qui sème le doute, une entreprise se présente systématiquement dès les décrochages, les interlocuteurs aussi. Un appel dans un lieu de ce genre génère un bruit de fond et comme le note Axios, rien. Pour une prise de réservation les sociétés tentent d’obtenir un nom de famille et un numéro de téléphone, libre au client de le donner ou non, mais l’employé cherche au moins à l’obtenir afin de rappeler en cas de retard pour ne pas bloquer un créneau ou une table inutilement. Là encore rien…

    Donc personne ne dit que les appels sont faux pour l’instant, mais Axios note tout de même que les conversations ne semblent pas naturelles comme la présentation tente de le laisser croire et sont sans doute « au moins » rééditées.

  2. Tout à fait d’accord avec cet article. Je suis ingénieur du son et il suffit d’écouter cette conversation une fois pour savoir que les voix sont ici toutes préenregistrées. Plus qu’une mise en scène, ce sont bien deux IA différentes qui ont conversé ensemble ! L’une à qui l’on a dit de se faire passer pour une employée qui répond au téléphone, l’autre pour celui qui veut prendre une réservation ou un rendez-vous. Amusant.

  3. Jean-Michel BERNARD le

    Il ne m’a même pas traversé l’esprit que cela pouvait être un VRAI salon et cela ne discrédite rien du tout je pense. L’interlocuteur joue le rôle d’un salon de coiffure et l’IA s’en sort très bien.
    Le but était de montrer la capacité de l’IA a tenir la conversation et prendre rendez-vous. Je ne pense pas qu’il souhaitait réellement se faire couper les cheveux.

    • Pour le coup, lors de la présentation, le mec de Google dit bien qu’il s’agit d’un enregistrement d’un vrai appel. Si ce n’est pas le cas c’est un mensonge.

      Par contre il dit aussi qu’ils ont enregistré comme ça un bon paquet d’appels pour avoir ces deux-là.

  4. Sans vouloir critiquer l’article, on ne m’a jamais demandé mon nom où numéro de téléphone lors d’un rendez-vous chez le coiffeur, la plupart du temps le but est juste d’homogeneiser les arrivées des clients sur la journée, donc celà ne prouve absolument rien.

    De plus Google nous a déjà pondu une IA capable de battre le champion du monde de go, alors qu’il est impossible de calculer toutes les possibilités (si je ne dis pas de bêtise, leur IA aux échecs fonctionnait juste par un calcul récursif d’un grand nombre de coups a l’avance).
    Donc de la à passer bientôt le test de turing et à passer pour un humain lors d’une conversation il n’y a qu’un pas.

    Rien de très compliqué ici, trouver une réponse humaine et appropriée est très facile pour une IA, la seule difficulté est de réussir à marquer les silences aux bons moments.

    Si Google nous dit qu’ils en sont capable, je les crois, aussi inquiétant que ça soit.
    Dans 5 ans tout au plus, on sera démarché au téléphone par des bots, peut être plus polis que les humains qu’on pousse au rendement habituellement d’ailleurs.

  5. C’est triste parce que presse-citron est bien trop vite devenu avale-pomme.
    Beaucoup trop triste… J’ai des professeurs qui connaissent très bien la direction, je ne sais pas comment on peut écrire un article aussi vide.

    Quitte à remettre en question ce genre d’actions, prenons les tenants et les aboutissants de cette démarche pour alphabet dans une période ou leur IA, jugé comme étant « la plus performante au monde » est pourtant moins apprécié que celle d’Amazon.

    Bref, c’est vide, très rare venant de presse-citron, mais presque écœurant tellement l’article sent plus la haine que la réflexion…

  6. Restons positif !
    C’est intéressant de challenger la présentation de Google et de garder l’esprit critique en alerte.
    Rien ne laisse sérieusement penser que cette « démo » est réelle. Lors du premier appel, les deux voix sont curieusement semblables, et la qualité de l’enregistrement, très métallique, permet de confondre la voix « humaine » du salon de coiffure avec un robot conversationnel.
    Pour la seconde, on a l’impression de deux chatbots qui s’ajustent… au « gotcha » près, qui, comme le « mmh », semblent artificiellement ajoutés….
    Même pour des voix américaines, le ton et le timbre restent étonnamment stables tout le long des conversations… et parfaitement compréhensibles pour un non-américain (presque pas d’accent, ni de terminaisons « avalées »)!
    Le problème est le discours de l’humain (?) qui présente cette démo, et qui semble croire que c’est vrai : a-t-il été mal briefé par les robots ? 😉
    Le jour où une telle conversation sera réelle, l’humanité aura renoncé à l’être : émotions, humour, politesse, fantaisie auront été bannis.
    Effectivement, le calibrage des conversations privées et publiques (lutte contre les discriminations, harcèlements, « respect », interdiction du « second degré »…) va rapidement rendre les relations humaines aussi insipides que les relations robotisées… et favoriser l’émergence de ces dernières !

Commenter

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.