Données vocales : une campagne de data funding contre le monopole des GAFAM et des BATX

15 mars 2021

Le Voice Lab lance une campagne de récolte des données vocales en collaboration avec Datafunding, afin de co-construire les prochaines technologies basées sur la voix. Décryptage des objectifs et enjeux.

Le Voice Lab propose une alternative française et européenne dans le domaine de la voice tech. © Le Voice Lab © Artram – stock.adobe.com

Le succès des applications vocales, enceintes connectées et assistants vocaux n’est plus à démontrer. Aujourd’hui, Alexa, Google Home ou encore Siri sont devenus des incontournables de la vie quotidienne. Ces technologies vocales s’intègrent dans un marché concurrentiel où les GAFAM détiennent le monopole, et où la question de la sécurité des données personnelles reste discutable.

Karel Bourgois est le président du Voice Lab. Cette association regroupe différents acteurs institutionnels (universités, laboratoires de recherche…) et des entreprises privées, dont l’intérêt commun est de constituer un écosystème indépendant et des standards pour permettre à la France et l’Europe de rester compétitives sur le marché de la voix au niveau mondial. Nous lui avons posé des questions concernant l’initiative de cette récolte de données en association avec la plateforme Datafunding.

Le marché de la voix est en pleine expansion, que ce soient les applications vocales ou les assistants vocaux, comment expliquer cet engouement ? Quels chiffres attestent de cet emballement ?

On a beaucoup parlé de « texting » ces dernières années, on disait que c’était la fin de la voix et la montée du texte. La réalité est plus compliquée : le monde numérique a participé à l’apparition d’une multitude de nouveaux canaux de communication et démontré que l’être humain est prolixe. Les progrès des technologies vocales (reconnaissance vocale et synthèse vocale) ont donc donné naturellement naissance à une prolifération de nouveaux services vocaux. Le dernier en date, ClubHouse, est passé en 2 mois de 1 à 10 millions d’utilisateurs et en 8 mois d’une valorisation de 100 millions de dollars à 1 milliard de dollars…

Sans compter qu’on prévoit 8 milliards d’assistants vocaux en circulation dans le monde d’ici 2023, soit une croissance annuelle de 25 % (Roland Berger).

Quels sont les usages les plus courants des assistants vocaux ?

Lorsqu’on évoque les assistants vocaux, on pense tout de suite aux enceintes connectées, telles que Google Home ou Alexa que l’on installe chez soi, et qui sont très utilisées partout dans le monde. Leur usage est encore très limité aux commandes vocales simples comme la gestion à la voix de la smart home – la domotique connectée : « allume la lampe du salon« , « lance le minuteur pour cuire les pâtes« . D’ailleurs, toutes les grandes marques d’équipement de la maison ont pris le pas pour devenir compatibles et connectées aux assistants. Un autre usage très répandu des assistants vocaux : les commandes vocales pour des actions simples liées à une utilisation personnelle : « fais-moi écouter un morceau de Nirvana », « quel temps fait-il à Paris demain ? ».

Les assistants vocaux ont la côte. © stock.adobe.com – Karneg

En revanche, tout a commencé avec le premier assistant vocal personnel de masse qui a été Siri, intégré dans iPhone depuis 2011. Ensuite fait son apparition Google Assistant (2016), disponible pour les smartphones avec le système d’exploitation Android, mais qui via son appli est accessible aujourd’hui également avec le système d’exploitation iOS. Ces assistants dans nos smartphones ont été un vecteur de popularisation auprès du grand public. D’autres usages liés aux commandes vocales vont s’imposer de plus en plus avec l’intégration des assistants dans les voitures, par exemple, ou dans n’importe quel objet connecté.

Un autre canal est tout autant impacté par l’ouverture des usages à la voix : c’est la téléphonie classique avec les secrétariats et les call centers. N’importe quel numéro de téléphone peut être connecté à un assistant appelé CallBot. Au lieu d’avoir un Serveur Vocal Interactif (SVI) qui vous demande « tapez 1, tapez 2 » ou « dites le nom du service que vous recherchez« , vous allez être en interaction avec un Callbot qui va échanger avec vous en langage naturel. Il va décrocher immédiatement et qualifier l’appel. Ensuite, en fonction de la compréhension de votre problématique, il vous donnera directement la réponse ou il effectuera l’action nécessaire afin de résoudre une demande, ou il pourra vous diriger vers un canal humain si besoin. Ces fonctionnalités sont très recherchées pour améliorer la satisfaction client et pour automatiser certaines questions, demandes et tâches à faible valeur ajoutée, et ainsi valoriser les équipes tout en créant de la valeur supplémentaire.

À l’heure actuelle, ce sont les GAFAM qui semblent avoir le monopole des données vocales. Quels sont les risques et les conséquences d’un tel monopole ?

La voix est l’une des composantes majeures de nos relations homme-machine. Avec un monopole par les GAFAM (ou tout autre acteur), il y a un risque de désintermédier les acteurs économiques français et européens. Imaginez qu’un acteur puisse décider quelle réponse donner à la question « quel est le meilleur produit pour… ». Cela signifie aussi que les moyens pour la recherche ne sont pas forcément mobilisés dans les directions que nous pourrions souhaiter. Imaginez-vous ce type d’acteur s’intéresser au Breton, par exemple ?

Quel enjeu représentent l’indépendance et la souveraineté française des données ?

L’enjeu pour l’écosystème français est de permettre aux acteurs économiques et publics de maîtriser le développement de l’industrie de la voice tech, de garder un secteur de recherche public qui soit de qualité, de faire en sorte que la richesse de la langue française soit aussi présente dans sa forme numérique. Tout cela repose sur la possibilité pour l’ensemble des acteurs de disposer de données riches, qualifiées, travaillées, pour entraîner les intelligences artificielles qui construisent les services vocaux d’aujourd’hui et de demain.

Vous lancez votre première campagne de Datafunding, quel sont les objectifs autour de cette récolte de données vocales ? À qui s’adresse cette campagne ?

Cette campagne est une façon de sensibiliser le grand public à la problématique et de lui donner une opportunité de contribuer à l’émergence d’un écosystème français concurrentiel. L’objectif est de lui donner l’occasion de réaliser la richesse et la valeur des données qu’il produit.

Nous avons un objectif de 2 000 heures, qui est symbolique car cela représente environ la totalité de la quantité de données disponibles aujourd’hui, sachant que le projet est d’atteindre 50 fois plus, soit 100 000 heures, au travers des travaux de l’Association.

Comment fonctionne cette récolte ? Quelles données sont collectées et comment sont-elles utilisées ?

Les données seront récoltées en utilisant la clause de portabilité des données du RGPD. Il suffit alors de faire une demande auprès des acteurs concernés et de nous transmettre le résultat. Notre partenaire Datafunding met en place l’automatisation de l’ensemble du processus.

La notion de protection des données personnelles et le RGPD prennent de plus en plus d’importance. Comment garantir le respect des données personnelles avec cette collecte ?

Tout l’intérêt est que Datafunding assure le traçage de la licence et permet de révoquer celle-ci en un clic.

Recevez par email toute l’actualité du digital



Source link

agence de communication à Rennes

Données vocales : une campagne de data funding contre le monopole des GAFAM et des BATX
Mot clé :                                        
Agence LDP