Navigation vocale embarquée sur lunettes AR
Vuzix a décidé de déployer les technologies vocales hors ligne du VDK pour offrir à ses utilisateurs une expérience 100% mains libres en portant ses lunettes intelligentes.
En bref…
Vuzix est une entreprise leader dans le domaine des lunettes de réalité augmentée (AR). Avec plus de 20 ans d’expérience, elle fournit à de nombreuses industries des fonctionnalités basées sur la vision pour un large éventail de cas d’usages. Afin d’améliorer les capacités de ses lunettes intelligentes, la société a décidé de développer des commandes vocales intégrées (en 30 langues) grâce à l’ASR du Voice Development Kit.
Challenge et exigences
Une IA vocale fiable offrant un large support linguistique pour les lunettes Vuzix M-Series
Pour améliorer les capacités visuelles des lunettes Vuzix M-Series Smart Glasses, les commandes vocales étaient le choix naturel à faire. S’agissant également d’une technologie cognitive, la voix suit les lignes directrices de la stratégie de l’entreprise : innovation, ergonomie et valeur pour l’utilisateur. Cependant, certaines exigences nécessitaient une attention particulière pour Vuzix et ses clients.
Support linguistique étendu
En tant que leader de l’industrie des lunettes AR, Vuzix a une portée mondiale. Il est important d’assurer une couverture linguistique complète, quelles que soient les zones, NA, EMEA, LATAM ou APAC et aussi avec différents dialectes et accents…
Un service fiable de reconnaissance vocale
Les lunettes intelligentes sont utilisées par les professionnels dans des secteurs tels que la logistique ou la santé. Parfois, ces secteurs sont affectés par des environnements spécifiques qui rendent difficile une connectivité parfaite.
Solution et spécifications
Reconnaissance vocale et mot déclencheur embarqués dans les lunettes AR Vuzix
À propos des technologies vocales
Le moteur de reconnaissance vocale automatique est basé sur la grammaire pour produire les commandes vocales et adapter les mots reconnus au vocabulaire spécifique du secteur. Il utilise également la technologie DCC (Dynamic Content Consumer) afin de disposer d’une flexibilité étendue des fonctions tout en couvrant 30 langues, dialectes et accents pour s’adapter à la portée mondiale de Vuzix.
Les utilisateurs finaux des lunettes intelligentes
Les personnes utilisant des lunettes AR de Vuzix proviennent de domaines très différents, des chaînes d’approvisionnement et des usines aux laboratoires et aux cliniques de chirurgie. Les profils concernés sont très hétérogènes en termes de compétences, ce qui est l’une des raisons de faciliter l’utilisation des fonctions de réalité augmentée par le biais d’interactions vocales.
Informations concernant le matériel
Les lunettes intelligentes fonctionnent sous le système d’exploitation Android 9.0 et intègrent un processeur Qualcomm XR1 à 8 cœurs de 2,52 GHz pour faire fonctionner le système d’exploitation Vuzix équipé du kit de développement vocal. Avec 6 Go de RAM LPDDR4 et 64 Go de mémoire flash interne, l’empreinte de la technologie vocale est transparente.
Pour les développeurs, par des développeurs
Commencez à développer votre solution d'IA vocale avec le VDK
1
Inscrivez-vous sur la Console
Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.
2
Développez et testez
Définissez et créez votre projet pour développer vos fonctionnalités.
3
Partagez votre projet
Partagez votre projet et discutez-en avec nos experts pour une intégration.
Démonstration produit
Les lunettes à commande vocale en cours d’utilisation
Dans cette vidéo, vous apprendrez comment les commandes vocales sont utilisées pour naviguer dans l’interface de l’appareil. Il est important de se rappeler que l’entrée vocale peut être utilisée dans n’importe quelle application (de Vuzix ou de tiers disponibles sur le marché).
Vuzix a récemment ajouté une fonction d’accessibilité qui permet à l’utilisateur de dire à haute voix les chiffres correspondant aux éléments de navigation.
Cas d’usages et applications existantes
Quelques cas d’usages déjà développés
Télémédecine
- « Montre-moi les instructions A1 »
- « Lancer l’enregistrement »
- « Lancer le retour vidéo »
- « Surveiller les signes vitaux »
Logistique d'entrepôt
- « Afficher la liste de contrôle B34 »
- « Démarrer l’enregistrement vidéo »
- « Valider l’opération X345-43 »
- « Lancer le scan automatique »
Fabrication
- « Afficher la vidéo de formation 1 »
- « Démarrer l’assistant visuel pour le produit X »
- « Afficher les processus du produit X »
- « Ouvrir le formulaire de contrôle qualité »
Opérations sur le terrain
- « Connecte-moi avec l’équipe de soutien »
- « Accepter le partage de la vision »
- « Afficher les instructions à distance »
- « Valider l’étape 2 »
Bénéfices et améliorations
Quelle valeur l’IA vocale apporte-t-elle aux lunettes AR ?
Interactions mains libres pour la sécurité
Pour répondre au besoin d’interactions tactiles, des technologies vocales ont été développées et intégrées. La voix a la capacité spécifique d’être utilisée en mains libres, ce qui renforce la sécurité des travailleurs dans les zones potentiellement dangereuses.
Apprentissage facile pour l'utilisateur
Les technologies vocales, qu’il s’agisse de reconnaissance ou de synthèse, permettent à l’utilisateur de se familiariser plus facilement avec le produit et son utilisation. L’apprentissage intuitif par la voix est la clé pour combler le fossé des compétences entre les collaborateurs.
Des fonctions plus rapides grâce aux commandes vocales
Les commandes vocales sont intuitives et plus rapides à produire que les interactions analogiques ou tactiles traditionnelles. De nombreuses fonctions disponibles dans les lunettes intelligentes, comme l’enregistrement ou le lancement d’un appel, bénéficient de cette productivité accrue.
Complément naturel aux éléments de réalité augmentée
Les technologies basées sur la vision sont de la même nature que la voix, le domaine des solutions cognitives. La voix peut fonctionner de manière transparente avec la vision pour produire des expériences révolutionnaires pour l’utilisateur qui apportent à la fois de la valeur et de l’ergonomie.
Des capacités vocales de pointe pour les lunettes intelligentes à réalité augmentée
Nous avons réuni des experts en lunettes intelligentes à réalité augmentée pour discuter avec notre équipe de la relation étroite entre les technologies vocales et visuelles.
Témoignage de notre client
« La large capacité de support linguistique de nos produits est un avantage concurrentiel distinct pour nous sur de nombreux marchés étrangers et nous sommes heureux de travailler avec un leader de la technologie vocale tel que Vivoka pour permettre cela. De plus, de nombreuses zones équipées des lunettes intelligentes Vuzix sont concernées par des environnements spécifiques qui rendent difficile une connectivité parfaite pour les solutions Cloud. Les solutions de Vivoka peuvent fonctionner hors ligne, sur l’appareil, pour fonctionner partout et à tout moment. »
Paul TRAVERS
Prise de décision
Pourquoi Vuzix a choisi le Voice Development Kit ?
Des tarifications claires
Les technologies du Voice Development Kit s’appuient sur des modèles tarifaires qui rendent le coût de l’innovation transparent et mesurable pour les entreprises.
Simplicité de la technologie
Avec une interface de prototypage sans code, le VDK Studio est l’outil idéal pour mettre la main sur les technologies vocales et créer des solutions sans compétences spécifiques.
Confidentialité des données
Étant sur l’appareil, les technologies de Vivoka fonctionnent tout le temps et partout, pour fournir un service disponible non-stop ainsi qu’une confidentialité sans faille aux utilisateurs.
Compatibilité technique
Les solutions légères de Vivoka peuvent fonctionner sur la plupart des frameworks et des dispositifs, des applications mobiles sous Android aux systèmes embarqués sous Linux…
Lancez la révolution vocale de votre entreprise aujourd'hui !
Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.
Réalisé avec le Voice Development Kit
Des cas d’usages innovants développés avec le VDK
C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale
Surmontez la pénurie de main-d’œuvre grâce à la technologie : Focus sur la logistique, les TMS et les WMS
La pénurie mondiale de main-d'œuvre perturbe de nombreux secteurs, mais certains ressentent la pression plus fortement que d'autres. La logistique, la fabrication, la construction, la santé et le...