Comment créer un assistant vocal embarqué en 25 minutes avec le Voice Development Kit ?

 

Créer un assistant vocal embarqué : les pré-requis importants.

 

Avant d’entamer un projet vocal, ce que vous êtes sûrement sur le point de faire si vous lisez cet article, il est nécessaire de bien préparer l’amont. En effet, créer un assistant ou une interface vocale, avec ou sans VDK, demande une certaine méthodologie.

Tout d’abord, il est important de bien cadrer les cas d’usages nécessaires à développer afin de proposer l’expérience d’utilisation la plus performante et agréable pour l’utilisateur (qu’il s’agisse d’un collaborateur ou d’un client final). Bien définir ces fonctionnalités permet d’estimer les ressources nécessaires (temps, technologies…) à leur réalisation.

En parallèle, le VDK est spécialisé dans les assistants vocaux embarqués, il y a donc d’autres paramètres à anticiper. Premièrement, cela concerne le hardware qui est prévu pour héberger l’assistant. La capacité de stockage ou le système d’exploitation vont largement influencer le développement nécessaire. L’embarqué (offline) contrairement au Cloud repose intégralement sur la partie matérielle de la solution pour fonctionner mais pas que : l’environnement d’utilisation va aussi induire s’il est nécessaire de traiter ou non l’audio en cas de pollution sonore.

Maintenant que vous avez globalement tous ces éléments en tête, nous pouvons attaquer la création de vos cas d’usages pour l’assistant vocal embarqué qu’il vous faut. Grâce au Voice development Kit (VDK), seulement 5 étapes sont à compléter pour avoir une solution déjà opérationnelle, très rapidement.

 

Étape 1 : Démarrer le VDK pour créer un projet et télécharger les ressources nécessaires.

 

vdk écran d'ouverture

 

Après avoir lancé le Voice Development Kit, la première vue est celle du workspace. Dans cet espace vous avez différentes possibilités : créer un nouveau projet, ouvrir un projet déjà existant ou accéder à la présentation de l’interface (visite guidée ci-après).

Pour ce tutoriel, nous allons choisir un assistant basique (caractérisé par l’utilisation du widget Simple Assistant Maker) en langue anglaise. En effet l’outil permet de montrer rapidement et facilement la puissance du VDK, bien que la partie personnalisée soit plus complète et adaptée à des cas d’usages poussés pour l’embarqué.

 

 

Cette présentation, que nous appelons “Visite guidée”, permet en quelques étapes de couvrir les principaux éléments de l’interface à propos de leurs emplacements respectifs et l’utilisation qui les concernent. C’est une étape importante pour les primo utilisateurs car l’outil, bien que facile d’utilisation, présente une mécanique auquel il est préférable de se familiariser avant de procéder.

Revenons à la première vue présentant le choix entre créer et ouvrir un projet. Dans notre cas, nous allons créer un nouveau projet et choisir “basic application” afin de se concentrer sur l’utilisation de SAM. Une fois les sélections faites, un dossier est créé automatiquement dans lequel les fichiers du projets seront regroupés.

 

 

 

Étape 2 : Ouvrir SAM pour créer les requêtes de l’assistant embarqué

 

Nous parlons de SAM depuis le début, il est maintenant temps de l’utiliser. Le Simple Assistant Maker est un outil créé par Vivoka afin de rapidement et facilement produire des cas d’usages vocaux comprenant une requête de l’utilisateur, des réponses par l’assistant et l’exécution d’une action (ici à travers un script). En ayant choisi “basic application”, ce widget se télécharge automatiquement pour être ajouté au workspace.

 

 

Une fois le plugin glissé sur le workspace vous aurez une fenêtre sous forme de tableau avec 2 colonnes apparentes :

  • “Input (ASR)” = la requête soumise à l’assistant.
  • “Output (TTS)” = la réponse donnée par le système.

 

En plus de ces deux premiers champs remplis, d’autres colonnes peuvent être ajoutées comme :

  • “Script” = l’action à effectuer.
  • “Post action output (TTS)” = la notification donnée après l’action réalisée.

 

Pour exemple, nous allons choisir les requêtes suivantes :

  • « Adds 3 units to Stock C” avec pour réponse “Done” et un script d’action.
  • « Generates the report for the administrator » avec pour réponse “The report is generated and ready to be sent” et un script d’action.
  • « Make a backup of the hard drive » avec pour première réponse “The backup will be completed in 4 minutes”, un script d’action et une réponse finale “Backup is complete”.

 

Ce qui, une fois dans SAM, nous donnes les éléments suivants :

 

 

Les scripts sont à créer en dehors du VDK et à associer dans l’interface de SAM. Une fois le tableau SAM complété, vous avez la possibilité d’exécuter la création de l’assistant pour ensuite le tester. Pour cela, il est nécessaire d’avoir un microphone en entrée audio et de configurer une voix TTS pour les outputs. Pour cela, continuons à l’étape 3.

 

Étape 3 : Évaluer et choisir les différentes voix avec TTS Benchmark

 

Le Voice Development Kit contient une banque importante de voix pour synthèse vocale. Ces dernières sont contenues dans la rubrique add-ons et la sous-catégorie “voix”. Rangées par fournisseur, genre, langue et qualité, les différentes voix sont téléchargeables pour être intégrées à vos projets.

 

 

Afin d’essayer les nombreuses voix disponibles, en dehors de la phrase par défaut du catalogue, le VDK dispose d’un plugin idéalement conçu : le TTS benchmark. Il permet de comparer les différentes voix téléchargées entre langues, fournisseurs, genre et qualité. Il suffit simplement de donner une phrase d’exemple et de comparer les différents rendus. Une fois choisies, ces voix pourront être choisies dans SAM via ses options.

 

 

Étape 4 : Tester et corriger les éléments du projet

 

Maintenant que les requêtes et les scripts sont configurés, que la voix choisie est la bonne, il reste à exécuter et tester les requêtes issues de SAM.  Ceci est l’étape juste avant l’export, il est donc important de bien vérifier que le résultat correspond vraiment aux attentes.

C’est également l’occasion de simuler l’expérience souhaitée via l’assistant vocal et d’éventuellement la compléter. En effet, le paramétrage étant déjà fait, il ne reste qu’à rajouter les différents éléments (input, output, script et éventuellement post action output) pour créer de nouveaux cas d’usages.

Dans le cas d’une erreur lors de l’exécution de SAM, les détails de la création de l’assistant sont présents dans la partie logs afin de corriger. Il peut s’agir d’un élément manquant ou d’un problème de configuration à corriger par exemple.

Si tout convient à vos attentes, il ne reste qu’à exporter pour intégrer l’assistant embarqué dans vos appareils. Rendez-vous dans l’étape suivante.

 

Étape 5 : Exporter les fichiers pour l’intégration

 

Dernière ligne droite de votre assistant vocal embarqué, l’étape de l’exportation. L’ouverture de l’outil d’export se fait dans la barre des menus du Voice Development Kit, dans “Fichier” puis “Exporter”. Vous obtiendrez ceci.

 

 

Tout d’abord, comme dans la création du projet, il est nécessaire de choisir un dossier/emplacement qui servira à accueillir le projet exporté.

Juste à côté, deux options sont affichées, de gauche à droite : le système d’exploitation voulu et l’architecture associée. Pour rappel il s’agit d’un assistant vocal embarqué, dépendant de paramètres techniques de votre ou vos hardwares, assurez-vous que l’ensemble est compatible !

Dans l’emplacement principal se trouve le détail du projet en cours d’utilisation lorsque vous avez décidé d’exporter, il sera choisi par défaut. Dans notre cas, il contiendra logiquement SAM et le TTS Benchmark. Tous les widgets exportables seront choisis selon l’architecture choisie précédemment, ceux qui ne sont pas exportables seront simplement désactivés.

Une fois l’ensemble des éléments renseignés et confirmés, l’exportation peut être lancée. En cas de problèmes, une fenêtre de logs (comme sur l’aperçu précédent) montre les détails du processus d’exportation et pointe la ou les potentielles erreurs.

 

Le Voice Development Kit, solution miracle pour créer un assistant vocal embarqué ?

 

A l’issue de ces 5 étapes, vous avez un assistant vocal embarqué prêt à être utilisé dans vos appareils. Dans notre cas, seulement 25 minutes ont été nécessaires pour créer l’assistant et l’intégrer. Évidemment, selon le degré de complexité de votre projet, ce temps va évoluer.

Cette efficacité et facilité pour développer des interfaces vocales embarquées vient du Voice Development Kit (VDK). Ce SDK avec interface graphique permet à toute entreprise et tout développeur de créer et configurer un assistant vocal offline composé d’une ou plusieurs technologies (transcription, synthèse, gestion des grammaires…) en un temps record.

 

Pourquoi utiliser le Voice Development Kit ?

 

Pourquoi ne pas utiliser le VDK justement ? Il s’agit du seul outil disponible aujourd’hui, spécialisé dans le vocal embarqué. En plus de faciliter énormément le développement, il permet de gagner du temps sur les différents processus afin d’offrir la meilleure délivrabilité possible.

Ce temps peut facilement être rapporté en ressource humaine qui coûte cher à l’entreprise en interne, autant que d’externaliser le projet à une société. En temps normal, les solutions vocales proposées sont rarement adaptées aux contraintes métiers. Il est donc très souvent nécessaire d’adapter la technologie et cela a un coût, d’autant plus que les garanties d’une solution opérationnelle de sont pas élevées.

Le VDK a été pensé avec ces problématiques comme premier point de douleur à résoudre. C’est pour cette raison qu’il offre une utilisation intuitive et une autonomie importante aux entreprises, pour un coût réduit comparativement au résultat offert.

Aujourd’hui le Voice Development Kit est un outil spécialisé pour les technologies vocales embarquées. Demain, il continuera d’évoluer pour proposer de nouvelles technologies, de nouveaux add-ons et toujours plus de facilité pour créer vos assistants vocaux.

 

Quels secteurs d’activité sont concernés ?

 

Le fait que le Voice Development Kit soit un logiciel généraliste permet à toutes les entreprises de l’utiliser. En effet, il n’a pas de spécialisation métier à l’origine, bien que les outils à disposition permettent de personnaliser les cas d’usages afin de les adapter à la réalité de nos clients.

Ainsi, qu’il s’agisse de la logistique, de la robotique, de l’IoT ou de l’industrie spécialisée, aucune barrière n’entrave l’utilisation du VDK pour créer un projet vocal.

 

 

 

Le Voice Development Kit vous intéresse ?

 

(Vous pouvez sélectionner plusieurs choix)