Panorama des technologies, tendances et enjeux du secteur vocal

9 novembre 2020

V-commerce, biométrie vocale, reconnaissance des émotions à travers la voix… Découvrez les tendances et les technologies émergentes d’un marché en plein essor.

Un état des lieux des technologies vocales, à l’occasion du salon Voice Tech Paris 2020. © bestforbest – stock.adobe.com

Alors que l’utilisation de la voix fait partie du quotidien de nombreux utilisateurs et que des tendances émergent actuellement, du fait de la crise sanitaire actuelle, nous avons interrogé Mélissa Périé, responsable des conférences de Voice Tech Paris, le salon de référence dédié aux technologies vocales qui est organisé du 23 au 24 novembre en ligne. Elle nous dresse un état des lieux du marché, nous précise ses champs d’application dans certains secteurs d’activité (automobile, santé…), ainsi que les bonnes pratiques à mettre en place pour l’utiliser.

Quelles sont les tendances des technologies vocales ?

Gagner du temps, favoriser le sans contact… La crise que nous traversons a permis à certaines tendances vocales d’émerger. La biométrie vocale, à savoir l’authentification par la voix, est de plus en plus courante et la technologie plus précise. En effet, sécuriser les opérations et gagner ou conserver la confiance de ses clients est primordial. Même si elle n’est pas sans danger, avec les deep fakes vocaux, l’idée que notre voix est également une empreinte vocale reste une prouesse. Cette technologie a également permis l’essor des courses et du paiement par la voix. La biométrie vocale comme la reconnaissance vocale font la part belle au Voice Commerce (V-Commerce). Les géants du web et de la grande distribution l’ont bien compris. Commander un livre ou du matériel de bricolage très spécifique peut désormais se faire depuis son canapé en faisant une requête à son enceinte vocale.

L’écoute et l’analyse des discours (speech analytics) revêtent elles aussi une importance majeure. Elles permettent non seulement de mieux connaître ses clients, mais également de répondre plus rapidement aux requêtes pré-identifiées. En effet, les callbots et autres voicebots sont désormais capables de comprendre une multitude de requêtes et l’analyse des échanges permet aux annonceurs de revoir leurs stratégies. C’est grâce aux technologies de reconnaissance du langage, dont sont issus le NLU (Natural Language understanding, à savoir la compréhension approfondie du langage humain) ou encore le NLG (Natural Language Generating, ou la génération automatique de réponses logiques), que les bots sont de plus en plus puissants et humanisés. Ces technologies sont de plus en plus utilisées pour réaliser des comptes rendus de réunion ou médicaux automatiquement.

Enfin, la reconnaissance des émotions fait des émules. C’est un enjeu majeur et une tendance grandissante dans le secteur du vocal. Elle consiste à détecter non plus uniquement le langage mais également les émotions et le caractère à un instant T. Intonations, souffle, ou encore tremblements, font partie des caractéristiques désormais détectables par les ordinateurs. Les bots peuvent adapter les échanges en ce sens. Cette technologie a également déjà été utilisée pour analyser les réactions humaines vocales face à de nouvelles situations.

Qu’est-ce que le voice UX et comment peut-il améliorer l’expérience utilisateur ?

Le voice UX est une discipline fascinante menée par des voice UX Designers. Ils pensent de façon holistique mais également de façon pragmatique en créant des commandes et interfaces vocales adaptées aux utilisateurs. Au même titre que l’UX, le voice UX est l’expérience utilisateur vécue lors de l’utilisation d’une application vocale. Elle est conçue pour garantir différents niveaux d’expériences à l’utilisateur : une fluidité d’utilisation, une compréhension rapide des requêtes… Ce qui permet notamment une fidélisation des utilisateurs.

Cette conception est possible par un travail d’enquête approfondi des UX designers. Dans quel contexte l’utilisateur va-t-il faire appel à l’application (en cuisinant, lorsqu’il est pressé, au volant d’une voiture…) ? Quelle personnalité et quel vocabulaire doit-on donner au robot qui échangera dans ce contexte ? Quelles sont les multitudes de scenarii à envisager ? Ce sont autant de questions et d’éléments clés dont il faut tenir compte et qui façonneront une application vocale adaptée.

Le voice UX fait partie intégrante d’une application vocale, et elle permet d’établir le meilleur contact possible avec le client.

En quoi les technologies vocales peuvent-elles révolutionner le secteur de l’automobile ?

Le cabinet Deloitte estime que le marché des assistants vocaux en voiture pourrait atteindre sept milliards d’euros d’ici 2021, alors que celui-ci représentait 1,5 milliard en 2017. Tous les nouveaux modèles de voitures ou presque sont désormais équipés d’un assistant vocal, les technologies de compréhension du langage naturel ayant considérablement évolué. On parle de plus en plus des voitures autonomes équipées de technologies vocales, cependant l’assistant n’intervient pas qu’à bord des voitures autonomes. Son rôle est d’informer et de sécuriser la conduite. Il va de soi qu’être au volant d’une voiture peut représenter des dangers, tout comme ce qui entoure le conducteur : passager, autres automobilistes, intempéries…. Les assistants vocaux, en lien avec les autres applications de la voiture, permettent de réduire l’utilisation du téléphone qui s’avère dangereuse, et donner des informations pratiques comme cruciales (localisation du parking le plus proche, danger imminent repéré…).

L’assistant garantit donc une meilleure sécurité à bord mais est aussi un enjeu business pour les marques. En effet, utiliser les applications habituelles d’un assistant vocal depuis sa voiture est possible. Rédiger un message, consulter l’actualité, faire ses courses… Enfin, il s’agit d’un atout commercial également pour les constructeurs automobiles, qui cherchent à se différencier et apporter de nouvelles expériences aux clients, tout en surfant sur la vague de l’atout « aide » et « sécurité ». Enfin, l’UX vocal propre aux assistants vocaux est un enjeu crucial, d’une part car il doit tenir compte des enjeux sécuritaires liés à la conduite, et d’autre part de l’expérience utilisateur qui doit être la plus simple et rapide possible, afin de ne pas déconcentrer le conducteur. On peut imaginer qu’à bord des voitures autonomes, le conducteur pourra dicter certaines indications au conducteur virtuel.

Qu’est-ce que le vocal peut apporter au secteur de la santé (AlloCovid…) ?

Tout comme pour la voiture, le vocal est partie prenante de la révolution en marche du secteur de la santé, et plus précisément de la Medtech. Jamais autant de projets n’ont été menés et développés que depuis le début de la pandémie mondiale. Le vocal s’est en effet illustré au début du confinement en France, via le serveur vocal intéractif AlloCovid. Les recherches déployées et la création d’algorithmes ont permis à différentes parties prenantes (AlloMédia, Oui SNCF, Inserm…) de déployer une plateforme d’écoute et de conseils automatisée à grande échelle. En effet, 1 000 robots vocaux sont capables de répondre en même temps à 1 000 personnes potentiellement positives à la COVID-19, et de les aiguiller vers les bonnes actions à entreprendre : faire un test, ne pas s’inquiéter, et même d’appeler automatiquement le SAMU si la personne au téléphone présente une détresse respiratoire audible. Cet outil très puissant a notamment permis de gagner du temps humain dans les diagnostics ou de rassurer les gens.

À une autre échelle, le speech-to-text, qui est une technologie consistant à retranscrire le discours oral en écrit, permet au corps médical de taper automatiquement leurs comptes-rendus médicaux. Cette prouesse permet non seulement d’actualiser automatiquement les dossiers médicaux des patients, de les analyser plus rapidement, mais aussi de passer plus de temps avec les patients, ou d’en voir davantage. Un hôpital de Boston a mis en place une application vocale, via Alexa d’Amazon, permettant de répondre aux parents d’enfants en postopératoire cardiaques et d’assurer ainsi un suivi. Amazon, comme Google et sans doute d’autres GAFAM, ont compris qu’investir dans la santé connectée via le vocal était un marché plein d’avenir.

Enfin, dans son livre blanc sur les assistants vocaux publié en septembre dernier, la CNIL prédit qu’en 2023 la CPAM lancera l’opération « Mon médecin traitant est un chatbot ». Celui-ci proposerait une consultation préalable avec un assistant virtuel avant une potentielle prise de rendez-vous médical. Quand on voit la puissance d’AlloCovid, cela ne semble pas impossible et pourrait être une solution pour désengorger le corps médical.

En quoi consiste le V-Commerce ? Avez-vous des exemples d’applications ?

Il s’agit de l’action de réaliser un achat par commande vocale, de la recherche produit, à la confection d’un panier et jusqu’au paiement. Cela peut se faire via son téléphone comme via son enceinte vocale, donc de façon nomade comme sédentaire. L’exemple le plus frappant récemment est celui de la dernière application vocale de Carrefour. En effet, elle offre la possibilité de réaliser son panier de produits entièrement à la voix, de le modifier à volonté, et d’aller jusqu’à l’étape finale de l’achat. Les commandes vocales sont enregistrées et permettent de connaître les préférences des utilisateurs, et donc à Carrefour de bien cibler ses clients à l’avenir. La grande distribution a su s’emparer des opportunités du commerce vocal. Ainsi Flipkart, la filiale indienne de Walmart, a lancé un service de commande de courses alimentaires par la voix. La prouesse de cet outil ? Il est capable de détecter toutes les langues, même locales, et permet également de payer par la voix.

À lire également
« Ok Google, je veux faire les courses » : l’achat alimentaire à la voix arrive sur l’Assistant Google

Quelles sont les bonnes pratiques pour les technologies vocales en matière de respect de la vie privée des utilisateurs ?

Début septembre 2020, la CNIL a publié un livre blanc intitulé « À votre écoute ». Il met en exergue que la voix et les éléments qu’elle apporte grâce à l’oralité (accent, provenance, caractère…), relèvent de la sphère personnelle et donnent des informations identitaires (biométriques), qui sont d’ailleurs usurpables. Aujourd’hui, les assistants vocaux ont pour obligation de demander l’autorisation d’enregistrer et d’utiliser leurs données vocales.

En revanche, le contrôle par l’utilisateur reste opaque. En effet, il n’y a pas de moyen de contrôle sur ses données, ni où elles vont et ce à quoi elles serviront réellement. La CNIL travaille activement sur ces aspects de bonnes pratiques, comme d’autres conglomérats. Début 2020 a été lancé le défi VoicePrivacy. Des chercheurs travaillent sur le développement de solutions d’anonymisation des données vocales, par la suppression des données personnelles. Ces initiatives laissent à penser que la question du respect de la vie privée est bel et bien mise sur la table.

Enfin, dans son livre blanc, la CNIL donne des exemples de bonne conduite en 5 étapes, à adopter pour être conforme à la législation en vigueur. En résumé, il s’agit de déterminer s’il s’agit de données personnelles, en définir le traitement, son responsable et sa base légale, définir quelles données sont sélectionnées, leur durée de conservation, informer les personnes et enfin les protéger et les sécuriser. Cela vaut pour les utilisateurs comme pour les concepteurs.

Quels seront les temps forts de l’événement Voice Tech Paris ?

 Voice Tech Paris, c’est 2 jours à la rencontre de l’écosystème des technologies vocales, utilisateurs comme fournisseurs. Nous offrons la possibilité d’échanger avec les concepteurs de solutions via leurs stands virtuels. Il est également possible d’assister à 20 conférences : des retours d’expériences avec des acteurs de secteurs variés (banque et assurance, industrie, transports, service…) mais aussi des keynotes et débats plus stratégiques. Nous avons notamment monté un débat sur la voix dans la société de demain. Nous aborderons aussi la question importante du moteur de reconnaissance vocale libre ou encore le deep fake audio. Nos programmes sont établis pour offrir un panorama complet des technologies et des enjeux liés au secteur du vocal.

Découvrez le programme complet du salon et réservez votre billet sur le site de Voice Tech Paris 2020.



Source link

agence de communication à Rennes

Panorama des technologies, tendances et enjeux du secteur vocal
Mot clé :                        
Agence LDP