Ce qu’il manque aux lunettes intelligentes pour se hisser aux sommets

Quand la vue rencontre la voix : une perspective de lunettes intelligentes

 

Les lunettes intelligentes sont des « wearables », comme les casques VR (réalité virtuelle), les montres et écouteurs connectés, etc. Elles intègrent des technologies avancées qui sont réduites pour fonctionner dans de petits appareils. « De grandes fonctionnalités impliquent une grande complexité ». Les utilisateurs, afin d’adopter les wearables, dans un contexte privé ou professionnel, ont besoin de méthodes spécifiques pour interagir avec cette innovation. Sur cette voie de l’adoption massive, les lunettes intelligentes, sous toutes leurs formes, sont arrivées à la conclusion que la voix est en fait l’un des nombreux moyens de contrôler ces dispositifs.

Les lunettes intelligentes, comme les autres dispositifs intelligents, sont des micro-ordinateurs. Étant portées comme des vêtements ou accessoires, elles ne peuvent être traitées de la même manière que les smartphones ou les ordinateurs. En effet, ces derniers sont conçus pour être utilisés avec les mains, ou atteints avec les mains. Alors que les lunettes doivent être portées sur la tête, à proximité de tous les autres sens humains qui ne sont pas « liés au toucher » comme la vision, l’audition ou… la voix !

Mais (oui, nous devons toujours faire face aux choses), les capacités vocales d’aujourd’hui ne correspondent pas à ce que nous, en tant qu’utilisateurs, attendons d’elles. C’est ce à quoi nous faisons référence de ce titre si mystérieux, des technologies vocales complexes, mais accessibles, à l’intérieur des lunettes intelligentes. Bien sûr, d’autres dispositifs portables peuvent et vont sûrement bénéficier de la voix, mais nous considérons les lunettes intelligentes comme l’exemple d’étude parfait.

 

Tout d’abord, jetons un coup d’œil à ce dont nous parlons…

 

Un aperçu (rapide) de ce que sont les lunettes intelligentes aujourd’hui

 

Comme nous l’avons mentionné, les lunettes intelligentes ne sont pas nouvelles. En fait, elles sont disponibles depuis quelques années et évoluent activement. Dans ce panorama technique, on retrouve bien sûr les géants de la tech (Google, Amazon, Xiaomi, Facebook…) qui cherchent principalement à ce que leurs lunettes soient portées par tous. Parmi eux, de nombreuses sociétés différentes (Vuzix, RealWear, Magic Leap, Rokid…) ont émergé pour suivre la même quête ou s’adresser à des domaines différents comme l’équipement des entreprises. Cet article n’a pas pour but de les énumérer toutes, d’autres blogs ont référencé les lunettes intelligentes AR bien mieux que nous ne pourrions le faire, avec de nombreux détails sur les fonctionnalités que nous vous invitons à consulter après avoir lu ce qui suit.

 

Qu’est-ce qui empêche les lunettes intelligentes de se hisser au sommet du panorama des « appareils intelligents » ?

 

Avec une prévision encourageante de 12,8 milliards de dollars de revenus d’ici 2028, les lunettes intelligentes devraient atteindre leur adoption massive, mais pourquoi cela prend-il autant de temps ? Selon l’analyse Facts & Factors 2021, le coût élevé de l’appareil, la dépendance à l’égard de la connexion Internet, l’immaturité de la technologie et le temps nécessaire au développement sont les principaux facteurs qui affaiblissent l’utilité perçue des lunettes intelligentes et donc la demande.

 

Facts & Factors Analysis – Global Smart Eyewear Market for Augmented Reality, Revenue (USD Million) 2016 – 2028

 

En plus de ces critères, la durabilité des appareils et l’adoption par les utilisateurs dans différents environnements (professionnels ou personnels) sont également des facteurs clés qui menacent l’évolution des lunettes intelligentes.

Heureusement, certaines industries soutiennent de plus en plus les lunettes intelligentes, au moins dans un contexte B2B : L’armée et la défense, la santé, l’industrie, l’éducation ou les jeux. Pour eux, des cas d’usages à forte valeur ajoutée peuvent être développés pour améliorer les processus et/ou fonctionnalités existantes

Avec une demande évidente mais un manque d’adoption, que peut-on faire pour que les lunettes intelligentes soient l’une des grandes révolutions du 21e siècle ?

 

Œuvrer sur les fonctionnalités et leur capacité ?

 

Les lunettes intelligentes sont en fait des micro-ordinateurs que les utilisateurs portent sur la tête. Ces cerniers peuvent déjà avoir accès à une pléthore de cas d’usage, visualisations AR (Augmented Reality), communications à distance, reconnaissance d’images par exemple, grâce à la compatibilité des technologies et aux progrès des logiciels qui peuvent les supporter. Mais dans l’ensemble, la voix n’est pas si développée, pas tant que les commandes vocales sont considérées comme la norme. En fait, il y a beaucoup plus d’usages que la voix peut apporter dans de tels dispositifs, mais personne n’a jamais fait un pas dans cette direction… quoi de plus ?

 

Travailler les interactions ?

 

Contrairement aux ordinateurs ou aux smartphones, ils ne sont pas équipés d’un clavier et d’une souris ou d’un écran tactile… Il s’agit donc d’interactivité ? Le toucher et les boutons sont la première chose qui vient à l’esprit, mais ils sont limités par leur taille et leur position, ce qui n’aide pas à être pratique. Pour être adoptés et plébiscités, les dispositifs innovants doivent être parfaitement compris et utilisés malgré leur complexité, c’est ici que la voix intervient comme le moyen le plus « mature » aujourd’hui d’interagir avec les lunettes intelligentes et appareils similaires.

 

Les technologies cognitives au secours des lunettes intelligentes manquant d’ergonomie

 

Nous pouvons classer les technologies cognitives en trois solutions réalisables aujourd’hui : la reconnaissance des gestes, des yeux (ou rétine) et de la voix. La première est prometteuse mais manque encore de précision, de performance, nécessite parfois du matériel supplémentaire et n’est pas si pratique sachant que les lunettes intelligentes sont censées être mains libres. La capture des yeux est quelque chose que beaucoup attendent dans le futur, la technologie n’est pas encore prête mais elle est très prometteuse. La reconnaissance vocale alors ? Toutes les lunettes intelligentes ne sont pas encore équipées de capacités vocales, mais la plupart des « grandes » lunettes le sont, et il y a une raison à cela.

En toute logique, les lunettes intelligentes se portent là où se trouvent la plupart des sens humains, la voix, la vue, l’ouïe… C’est pourquoi la voix a été un indice si intéressant dans le développement et l’évolution de ces dispositifs. Mais elle doit continuer à progresser.

Attention, nous ne disons pas que la voix est la seule chose qui empêche les lunettes intelligentes de briller. Beaucoup y ont pensé avant, beaucoup ont déjà équipé leurs appareils de cette fonction. Nous voulons simplement promouvoir la reconnaissance vocale dans un cas d’usage où elle n’est pas seulement considérée comme un gadget, mais comme un moyen réel, pertinent, bénéfique, d’interagir avec la technologie ! Et ceci, uniquement avec de simples commandes vocales, imaginez avec toute la gamme de solutions que nous avons…

 

Qui sont les acteurs de la voix sur cette industrie ?

 

Qui se cache donc derrière les « voix » des lunettes intelligentes ? Google, Facebook, Amazon, Microsoft, Nuance (qui pourrait être inclus dans celui de Microsoft), Vivoka ou des logiciels personnalisés propres à chaque entreprise. Bien sûr, cette liste n’est pas exhaustive à 100 %, mais elle couvre la majeure partie du marché.

 

Pourquoi n’est-ce pas encore « suffisant » ?

 

Tout d’abord, la précision de la reconnaissance vocale. Les moteurs vocaux généralistes seront capables de transcrire la plupart des commandes et des intentions, mais auront du mal à comprendre les vocabulaires complexes qui sont souvent présents dans les environnements professionnels.

La latence également, lorsque l’on travaille avec des technologies en Cloud qui souffrent d’une dépendance à l’égard d’Internet, ce qui est particulièrement critique dans les zones reculées. L’absence de couverture linguistique et de tolérance aux accents/dialectes sont également des éléments trompeurs pour les entreprises qui souhaitent déployer leurs produits à l’échelle mondiale et travailler avec de nombreuses populations différentes. Enfin, nous pouvons également mentionner qu’à partir de maintenant, seules la transcription vocale et les mots déclencheurs ont été utilisés dans les lunettes intelligentes (et les dispositifs basés sur la vision également).

En fait, l’éventail des technologies disponibles laisse une grande place à de nouveaux cas d’usages.

 

Ce que nous voyons comme la façon dont les lunettes intelligentes devraient être en termes d’assistance vocale.

 

Bien sûr, les innovations radicales, nous adorons. En tant que technophiles ou utilisateurs, nous sommes toujours à la recherche de nouvelles fonctionnalités, notamment en matière d’assistance vocale. Mais est-ce toujours nécessaire ? La plupart des utilisateurs, lorsqu’ils utilisent quelque chose de nouveau, sont rapidement déçus par les mauvaises expériences. Alors pourquoi ne pas en faire moins mais en faire mieux ? Par exemple, l’un des derniers clients de Vivoka, Vuzix, a choisi le Voice Development Kit pour créer des commandes vocales intégrées à des fins de navigation et cela fonctionne étonnamment bien avec rapidité et précision (et 43 langues sont supportées…).

 

 

Par ailleurs, les technologies Cloud sont excellentes et leurs capacités sont pratiquement illimitées. Mais, pas d’internet, pas de Cloud. Dans des cas moins extrêmes et plus répandus : une connexion internet de mauvaise qualité, une latence élevée. Mélangez-les comme vous voulez, mais le problème demeure. Bien sûr, là où il y a un problème, il y a une solution. Les technologies embarquées existent depuis des décennies et restent souvent dans l’ombre de ce que les technologies en nuage peuvent faire. Mais l’embarqué signifie pas d’internet, pas de données et avec les dernières avancées dans les tailles et les capacités des modèles, l’embarqué a de sérieuses réponses à ses détracteurs et séduira également beaucoup d’entreprises grâce à sa résilience.

 

Si nous voulons nous lancer dans des fonctionnalités encore plus innovantes, nous pouvons certainement mentionner la biométrie vocale pour une authentification et une identification rapides et transparentes ou la synthèse vocale pour fournir des informations audio. En effet, la voix ne consiste pas seulement à donner des ordres à une machine, elle peut aussi apporter une relation beaucoup plus « humaine » avec elle. Nous sommes plus que confiants dans l’avenir des technologies vocales dans les « wearables », et en particulier dans les technologies basées sur la vision. Il y a beaucoup de complémentarités naturelles entre les différentes solutions et ce dans quoi elles sont spécialisées.

 

À ce stade, vous voulez surtout savoir ce que tout cela peut apporter aux lunettes intelligentes (et aux wearables en tous genres) ? Nous vous suggérons de vous inscrire pour recevoir l’article de la semaine prochaine sur ce sujet spécifique (ou revenez la semaine prochaine…) !

 

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Inscrivez-vous sur la Console

Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Partagez votre projet

Partagez votre projet et discutez-en avec nos experts pour une intégration.

console by vivoka - demo ar/vr francais

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale