L’IA vocale pour humaniser les applications de la robotique

Zorabots a choisi le VDK pour ajouter des capacités vocales avancées dans son logiciel ZBOS. L’ensemble de la famille robot est à présent dotée de contrôle vocal.

01/2021
Interactions homme-machine naturelles grâce à l'IA vocale
Robots grand public et professionnels
Wake Word, Automatic Speech Recognition, Text-to-Speech

En bref…

Zorabots est la société qui a créé la plateforme ZBOS, un logiciel unique permettant de donner vie à tout appareil intelligent. Il s’agit d’un écosystème d’applications locales et en nuage qui fonctionnent ensemble de manière transparente pour offrir une expérience utilisateur innovante grâce à la robotique. Afin d’améliorer les interactions homme-machine, Zorabots a choisi le Voice Development Kit pour ajouter une puissante reconnaissance du langage naturel et une parole vivante afin d’humaniser sa famille de robots.

Challenge et exigences

Améliorer la relation homme-machine avec les technologies cognitives

Les robots humanoïdes imitent naturellement ce que nous, humains, expérimentons et comment nous intéragissons avec le monde. Toutefois, la complexité du comportement humain est compliquée à saisir et à transformer en solutions. Pour approcher ce que pourrait être une interaction entre humains, il est important de se pencher sur les technologies cognitives telles que la voix.

Reconnaissance de la parole sur-mesure

Une interaction homme-machine s’appuie principalement sur la précision et la réduction de la frustration utilisateur. Imaginez parler à quelqu’un d’autre qui ne peut vous comprendre, la même chose s’applique aux robots humanoïdes. La précision et la flexibilité sont les composantes clés.

Voix naturelles

Les Serveurs Vocaux Intéractifs (SVI) dans les centres d’appels sont connus pour leurs voix robotiques guidant les utilisateurs dans l’entonnoir de conversion. Avec des robots, le sentiment de voix doit être aussi proche que possible de ce qu’un humain pourrait produire à travers une prosodie complexe.

 

Solution et spécifications

Le mot déclencheur, l’ASR et le TTS en local pour des expériences vocales de bout en bout

À propos du système d'IA vocale

Ce projet inclut plusieurs technologies vocales pour permettre ce qu’on appelle une IA vocale de bout en bout. Tout d’abord, un mot déclencheur a été développé pour réveiller naturellement le flux d’interactions du robot à contrôle vocal avec des phrases personnalisées types « Hey Robin ».

Ensuite vient la partie de reconnaissance avec l’ASR. Notre technologie est basée sur la grammaire dynamique pour permettre la compréhension de vocabulaire spécifique ainsi que d’une multitude d’alternatives. Cet ASR n’est pas aussi flexible que le FreeSpeech mais permet une haute précision avec n’importe quel langage et vocabulaire.

Pour finir, la synthèse vocale naturelle a été conçue avec du SSML (un langage de balisage spécifique au TTS) pour répondre aux utilisateurs avec une voix similaire à celle d’un humain.

Les utilisateurs finaux de la solution

La plupart des utilisateurs finaux de Zorabots sont des étudiants qui travaillent dans le secteur des STIM. Ils développent des fonctionnalités au sein des robots et cette nouvelle interface homme-machine est à la fois un moyen de développer de nouvelles fonctions et un moyen d’interagir simplement avec leur création.

Intégrés dans l'application existante de l'entreprise

La majorité de la famille de robot Zorabots fonctionnent sur unités de microprocesseur issus de différentes marques de semiconducteurs. Tous présentent des caractéristiques matérielles qui permettent à la pile technique de l’appareil de fonctionner de manière fluide et transparente avec les autres fonctions.

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Inscrivez-vous sur la Console

Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Partagez votre projet

Partagez votre projet et discutez-en avec nos experts pour une intégration.

console by vivoka - demo ar/vr francais

Bénéfices et améliorations

Quelle valeur l’IA vocale apporte-t-elle à la robotique ?

Relation homme-machine

Être capable de parler naturellement avec un robot contrôlé à la voix permet à l’utilisateur d’adapter son comportement comme s’il était entrain de parler avec un autre humain. Cela permet aux développeurs d’imiter des situations réelles dans la conception d’application de robotique.

Adoption accélérée

La parole humaine comme méthode d’interaction est intuitive pour tout le monde, indépendamment de l’expérience avec les interfaces technologiques. L’adoption des utilisateurs est grandement améliorée avec l’usage de technologies cognitives.

Donner vie à tout appareil

L’IA vocale donne vie aux appareils et objets en les dotant de la capacité d’interagir avec les humains sur une base commune : la voix. C’est d’autant plus important pour les entreprises comme Zorabots qui travaillent activement pour donner vie aux produits intelligents.

Compatible avec les autres technologies

Les technologies vocales sont seulement une des différentes solutions qui peuvent être développées pour les applications de robotiques. En effet, la plupart des robots sont dotés d’autres technologies cognitives comme la reconnaissance des visages ou des images et d’autres capteurs qui coexistent avec l’IA vocale.

Témoignage de notre client

« Notre ambition est de proposer des solutions qui rassemblent les meilleures technologies tout en restant le plus universel possible. L’interopérabilité entre plusieurs solutions doit être invisible pour l’utilisateur. C’est là tout le défi ! Aujourd’hui, ZBOS embarque des solutions TTS (Text To Speech) et ASR (Automatic Speech Recognition). En ce sens, nous avons trouvé avec Vivoka une technologie qui fonctionne très bien, fiable et à la hauteur de nos besoins et défis. »

Tommy DEBLIECK

Directeur général

Prise de décision

Pourquoi Zorabots a choisi le Voice Development Kit ?

Des tarifications claires

Les technologies du Voice Development Kit s’appuient sur des modèles tarifaires qui rendent le coût de l’innovation transparent et mesurable pour les entreprises.

Simplicité de la technologie

Avec une interface de prototypage sans code, le VDK Studio est l’outil idéal pour mettre la main sur les technologies vocales et créer des solutions sans compétences spécifiques.

Privé par nature

Étant sur l’appareil, les technologies de Vivoka fonctionnent tout le temps et partout, pour fournir un service disponible non-stop. Cette exigence est encore plus importante pour assurer une expérience utilisateur sans faille.

Compatibilité technique

Les solutions à faible empreinte de Vivoka peuvent fonctionner sur la majorité des frameworks et matériels, depuis les applications mobiles sur Android jusqu’aux systèmes embarqués avec Linux.

Adopter la voix commence ici, avec Vivoka

Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale