+33 (0)9 71 00 03 70 contact@vivoka.com

Assistants vocaux et Big Data : Qu’en est-il des données ?

Article Voice Assistant Big Data
Favicon Vivoka Author

écrit par Vivoka

25 février 2021

Nous ne le présentons plus, vous le lisez dans le titre, nous allons parler de big data (ou méga données). Ce tournant majeur de la décennie est certainement ce qui a le plus affecté la manière dont les entreprises, notamment dans le domaine des technologies de l’information, ont repensé toute leur stratégie. Cette tendance, menée par les plus grands acteurs technologiques, a placé les données au centre de l’attention, déjà parce que nous sommes aujourd’hui capables d’en générer et d’en traiter une quantité énorme, mais aussi parce qu’elle pose les bases de l’intelligence artificielle auto-apprenante (cf. apprentissage automatique). Cette émergence, en plus de bouleverser la plupart des marchés, a remodelé l’économie, en termes de R&D, de Business Models ou encore de profils recherchés dans les entreprises, en plaçant les données en son centre.

Maintenant que cette petite introduction a été faite, entrons dans le vif du sujet, les données ont-elles une quelconque importance sur nos technologies, comme les assistants vocaux par exemple ?

 

Quelle est la relation entre les données et les assistants vocaux ?

 

Revenons à l’origine, qu’est-ce qu’un assistant vocal en fait ? C’est une intelligence artificielle équipée de différentes technologies liées au domaine de la voix (STT, NLP, TTS pour en nommer quelques unes, nous vous conseillons de lire notre article sur la reconnaissance vocale pour mieux comprendre). Ayant cette nature d’IA (intelligence artificielle), les assistants vocaux sont donc totalement liés aux Big Data car les modèles sur lesquels ils sont conçus en dépendent beaucoup.

Pour être plus précis, la majorité des assistants que vous connaissez ou utilisez aujourd’hui sont développés grâce aux technologies d’apprentissage automatique (Machine Learning, Deep Learning etc…) qui sont des algorithmes capables de traiter des informations pour en tirer des connaissances. Ainsi, pour disposer d’un système intelligent, capable de comprendre et de s’adapter à de nombreuses situations, il est fortement recommandé de lui administrer un maximum de données.

 

Pourquoi les données sont-elles importantes pour les technologies vocales ?

 

C’est un peu le même principe que pour nous, les humains, les données sont assimilées à des connaissances, donc fournir des données qualitatives à un modèle capable de les traiter, c’est comme donner un bon enseignement. Dans ce cas, l’Homme et la Machine deviennent efficaces parce que la base de connaissances sur laquelle ils reposent est exhaustive et précise. Inversement, vous aurez compris qu’il y a des lacunes.

Depuis leur apparition dans les années 2010, les assistants vocaux sont en concurrence pour les taux de compréhension. Parfois 95%, parfois 95,3%, il s’agit d’aller plus loin à chaque fois pour atteindre le meilleur pourcentage. Pour y parvenir, vous vous en doutez, il s’agit d’avoir des modèles performants, une suite optimale de technologies, le tout propulsé par quoi ? Des données.

Le problème étant que pour des solutions très généralistes comme celles du GAFAM, il est difficile d’avoir des données capables de couvrir tous les profils d’utilisateurs. Ainsi, les technologies d’intelligence artificielle, qui non seulement nécessitent de grandes quantités d’informations, intègrent ces données à partir d’enregistrements vocaux qui correspondent à la majorité des individus. Par conséquent, les personnes ayant un fort accent ou ayant des difficultés à s’exprimer ne peuvent pas utiliser les assistants vocaux de ces entreprises.

 

Est-ce que tous les assistants vocaux sont concernés par les données ?

 

Ceci représente la séparation visible aujourd’hui dans le monde des assistants vocaux. D’une part, il existe des assistants ultra-génériques, ambitieux de répondre à la moindre demande et donc très dépendants de données aussi exhaustives que possible. D’autre part, il existe des assistants vocaux dédiés, adaptés à des contextes et environnements particuliers, qui ne nécessitent dans ce cas qu’un petit champ de données, très relatif à leur utilisation. Par exemple, un assistant vocal dans l’industrie hôtelière devra connaître en priorité le jargon et le vocabulaire hôtelier associé à l’environnement. Selon le cas d’utilisation, la rigueur lexicale sera différente et donc le besoin en données variera.

Comme d’autres technologies qui se répandent aujourd’hui, les assistants vocaux sont toujours dépendants des données car les modèles sur lesquels ils sont basés l’exigent. Ainsi, tant la quantité que la qualité des données sont importantes et surtout corrélées : l’idéal est d’avoir des données aussi riches que possible. Heureusement pour nos assistants, la course aux données n’est pas encore terminée. Pour vraiment perdurer dans notre vie quotidienne, les solutions vocales doivent évoluer, ce qui passe nécessairement par la formation de l’intelligence artificielle.

Votre projet n’a jamais été aussi proche de sa solution !

En parcourant nos projets et nos technologies, vous avez peut-être pu vous faire une idée des possibilités que vous avez en travaillant avec nous. Nous pouvons également vous aider à atteindre vos objectifs.