Navigation vocale embarquée sur lunettes AR

Vuzix a décidé de déployer les technologies vocales hors ligne du VDK pour offrir à ses utilisateurs une expérience 100% mains libres en portant ses lunettes intelligentes.

10/2021
Navigation vocale sur les lunettes intelligentes
Lunettes intelligentes Vuzix M100/1000
Wake Word, Automatic Speech Recognition

En bref…

Vuzix est une entreprise leader dans le domaine des lunettes de réalité augmentée (AR). Avec plus de 20 ans d’expérience, elle fournit à de nombreuses industries des fonctionnalités basées sur la vision pour un large éventail de cas d’usages. Afin d’améliorer les capacités de ses lunettes intelligentes, la société a décidé de développer des commandes vocales intégrées (en 30 langues) grâce à l’ASR du Voice Development Kit.

Challenge et exigences

Une IA vocale fiable offrant un large support linguistique  pour les lunettes Vuzix M-Series

Pour améliorer les capacités visuelles des lunettes Vuzix M-Series Smart Glasses, les commandes vocales étaient le choix naturel à faire. S’agissant également d’une technologie cognitive, la voix suit les lignes directrices de la stratégie de l’entreprise : innovation, ergonomie et valeur pour l’utilisateur. Cependant, certaines exigences nécessitaient une attention particulière pour Vuzix et ses clients.

Support linguistique étendu

En tant que leader de l’industrie des lunettes AR, Vuzix a une portée mondiale. Il est important d’assurer une couverture linguistique complète, quelles que soient les zones, NA, EMEA, LATAM ou APAC et aussi avec différents dialectes et accents…

Un service fiable de reconnaissance vocale

Les lunettes intelligentes sont utilisées par les professionnels dans des secteurs tels que la logistique ou la santé. Parfois, ces secteurs sont affectés par des environnements spécifiques qui rendent difficile une connectivité parfaite.

Solution et spécifications

Reconnaissance vocale et mot déclencheur embarqués dans les lunettes AR Vuzix

À propos des technologies vocales

Le moteur de reconnaissance vocale automatique est basé sur la grammaire pour produire les commandes vocales et adapter les mots reconnus au vocabulaire spécifique du secteur. Il utilise également la technologie DCC (Dynamic Content Consumer) afin de disposer d’une flexibilité étendue des fonctions tout en couvrant 30 langues, dialectes et accents pour s’adapter à la portée mondiale de Vuzix.

Les utilisateurs finaux des lunettes intelligentes

Les personnes utilisant des lunettes AR de Vuzix proviennent de domaines très différents, des chaînes d’approvisionnement et des usines aux laboratoires et aux cliniques de chirurgie. Les profils concernés sont très hétérogènes en termes de compétences, ce qui est l’une des raisons de faciliter l’utilisation des fonctions de réalité augmentée par le biais d’interactions vocales.

Informations concernant le matériel

Les lunettes intelligentes fonctionnent sous le système d’exploitation Android 9.0 et intègrent un processeur Qualcomm XR1 à 8 cœurs de 2,52 GHz pour faire fonctionner le système d’exploitation Vuzix équipé du kit de développement vocal. Avec 6 Go de RAM LPDDR4 et 64 Go de mémoire flash interne, l’empreinte de la technologie vocale est transparente.

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Inscrivez-vous sur la Console

Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Partagez votre projet

Partagez votre projet et discutez-en avec nos experts pour une intégration.

console by vivoka - demo ar/vr francais

Démonstration produit

Les lunettes à commande vocale en cours d’utilisation

Dans cette vidéo, vous apprendrez comment les commandes vocales sont utilisées pour naviguer dans l’interface de l’appareil. Il est important de se rappeler que l’entrée vocale peut être utilisée dans n’importe quelle application (de Vuzix ou de tiers disponibles sur le marché).

Vuzix a récemment ajouté une fonction d’accessibilité qui permet à l’utilisateur de dire à haute voix les chiffres correspondant aux éléments de navigation.

Cas d’usages et applications existantes

Quelques cas d’usages déjà développés

Télémédecine

  • « Montre-moi les instructions A1 »
  • « Lancer l’enregistrement »
  • « Lancer le retour vidéo »
  • « Surveiller les signes vitaux »

Logistique d'entrepôt

  • « Afficher la liste de contrôle B34 »
  • « Démarrer l’enregistrement vidéo »
  • « Valider l’opération X345-43 »
  • « Lancer le scan automatique »

Fabrication

  • « Afficher la vidéo de formation 1 »
  • « Démarrer l’assistant visuel pour le produit X »
  • « Afficher les processus du produit X »
  • « Ouvrir le formulaire de contrôle qualité »

Opérations sur le terrain

  • « Connecte-moi avec l’équipe de soutien »
  • « Accepter le partage de la vision »
  • « Afficher les instructions à distance »
  • « Valider l’étape 2 »

Bénéfices et améliorations

Quelle valeur l’IA vocale apporte-t-elle aux lunettes AR ?

Interactions mains libres pour la sécurité

Pour répondre au besoin d’interactions tactiles, des technologies vocales ont été développées et intégrées. La voix a la capacité spécifique d’être utilisée en mains libres, ce qui renforce la sécurité des travailleurs dans les zones potentiellement dangereuses.

Apprentissage facile pour l'utilisateur

Les technologies vocales, qu’il s’agisse de reconnaissance ou de synthèse, permettent à l’utilisateur de se familiariser plus facilement avec le produit et son utilisation. L’apprentissage intuitif par la voix est la clé pour combler le fossé des compétences entre les collaborateurs.

Des fonctions plus rapides grâce aux commandes vocales

Les commandes vocales sont intuitives et plus rapides à produire que les interactions analogiques ou tactiles traditionnelles. De nombreuses fonctions disponibles dans les lunettes intelligentes, comme l’enregistrement ou le lancement d’un appel, bénéficient de cette productivité accrue.

Complément naturel aux éléments de réalité augmentée

Les technologies basées sur la vision sont de la même nature que la voix, le domaine des solutions cognitives. La voix peut fonctionner de manière transparente avec la vision pour produire des expériences révolutionnaires pour l’utilisateur qui apportent à la fois de la valeur et de l’ergonomie.

Des capacités vocales de pointe pour les lunettes intelligentes à réalité augmentée 

Nous avons réuni des experts en lunettes intelligentes à réalité augmentée pour discuter avec notre équipe de la relation étroite entre les technologies vocales et visuelles.

Témoignage de notre client

« La large capacité de support linguistique de nos produits est un avantage concurrentiel distinct pour nous sur de nombreux marchés étrangers et nous sommes heureux de travailler avec un leader de la technologie vocale tel que Vivoka pour permettre cela. De plus, de nombreuses zones équipées des lunettes intelligentes Vuzix sont concernées par des environnements spécifiques qui rendent difficile une connectivité parfaite pour les solutions Cloud. Les solutions de Vivoka peuvent fonctionner hors ligne, sur l’appareil, pour fonctionner partout et à tout moment. »

Paul TRAVERS

Chief Executive Officer

Prise de décision

Pourquoi Vuzix a choisi le Voice Development Kit ?

Des tarifications claires

Les technologies du Voice Development Kit s’appuient sur des modèles tarifaires qui rendent le coût de l’innovation transparent et mesurable pour les entreprises.

Simplicité de la technologie

Avec une interface de prototypage sans code, le VDK Studio est l’outil idéal pour mettre la main sur les technologies vocales et créer des solutions sans compétences spécifiques.

Confidentialité des données

Étant sur l’appareil, les technologies de Vivoka fonctionnent tout le temps et partout, pour fournir un service disponible non-stop ainsi qu’une confidentialité sans faille aux utilisateurs. 

Compatibilité technique

Les solutions légères de Vivoka peuvent fonctionner sur la plupart des frameworks et des dispositifs, des applications mobiles sous Android aux systèmes embarqués sous Linux…

Adopter la voix commence ici, avec Vivoka

Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale