Reconnaissance automatique de la parole hors-ligne
Notre kit de développement logiciel (SDK) permet de donner de la voix à vos produits et services grâce à la reconnaissance automatique de la parole et sa compréhension du vocabulaire complex.

Pour se familiariser avec l’ASR
Qu’est-ce que la reconnaissance automatique de la parole ?
La reconnaissance automatique de la parole, aussi connue sous le nom de Speech-to-Text ou juste reconnaissance vocale, est la principale technologie qui fait de la voix un moyen d’interagir.
Au sommet de l’IA vocale, cela rassemble plusieurs solutions comme les modèles acoustiques, le traitement du langage naturel (NLU ou le traitement du signal vocal. C’est cet ensemble qui permet à la reconnaissance vocale de transformer la parole humaine en données normalisées (texte, intention, valeurs…) qui peuvent être traitées par les machines.

Cas d’usages et applications
Comment tirer parti de la reconnaissance automatique
de la parole sur le terrain ?

Wearables
- Les lunettes AR à commandes vocales
- Dictée vocale en VR
- Casques à contrôle vocal

Industrie 4.0
- Picking vocal
- Dictée vocale pour rapport de terrain
- Contrôle qualité à la voix

Électroménager
- Réfrigérateurs, fours intelligents etc…
- Éléctronique industrielle mains-libres
- Assistants vocaux personnalisés

Services de terrain
- Assistant de maintenance
- Rapport à la voice
- Main d’oeuvre assistée par la voix

Robotique
- Robotique guidée par la voix
- Outils médicaux mains-libres
- Interface Homme-Machine

Défense
- Équipement militaire mains-libres
- Contrôle vocal pour solutions d’entraînement
- Maintenances spécifiques
Fonctionnalités
Comment utiliser la reconnaissance de la parole hors-ligne
Reconnaissance par la grammaire
La technologie de reconnaissance basée sur la grammaire est utilisée pour créer des commandes vocales plus précises et fiables. Liée à la dictée vocale, cela permet d’approfondir la solution avec une compréhension de l’intention s’appuyant sur la création de grammaire.
Transcription vocale libre
La transcription vocale est basée sur des modèles d’apprentissage du langage qui sont utilisés pour transformer les signaux audio en texte. Les résultats sont statistiquement déterminés selon la structure de phrase la plus fréquente et l’occurrence de mots en fonction du contexte.
Bénéfices
Pourquoi notre reconnaissance automatique de la parole ?

Hors connexion
Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.

Haute précision
Peu importe l’environnement, la population d’utilisateurs ou la complexité du vocabulaire.

Protection des données
Les données utilisateurs ne sont pas transférées et restent à l’abri des failles de sécurité.

Traitement en temps réel
Pas de latence pour un processus d’amélioration de l’audio transparent.

Maîtrise des coûts
Pas de frais cachés. Nous travaillons avec le modèle d’affaires qui vous convient.

Facile à intégrer
Simple du développement à l’intégration sur toutes les plateformes (windows, linux, android…).
Adopter la voix commence ici, avec Vivoka
Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.
Les entreprises qui ont choisi notre solution
Les retours de nos clients concernant nos technologies

“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”
Guillaume Jégou
Responsable laboratoire Human Factors Technology

"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."
Paul Travers
Directeur général

"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."
Cédric Vincent
VP de la technologie logicielle
Pour les développeurs, par des développeurs
Commencez à développer votre solution d'IA vocale avec le VDK
1
Faites une demande d'essai
Partagez vos informations pour accéder à l'évaluation du VDK.
2
Développez et testez
Définissez et créez votre projet pour développer vos fonctionnalités.
3
Exportez et intégrez
Technologies compatibles avec Windows, Android ou Linux.

Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...
Le support des langues n'est pas un problème

Anglais

Suédois

Indonésien

Thai

Français

Russe

Hollandais

Norvégien

Italien

Portugais

Coréen

Polonais

Allemand

Arabe

Danois

Ukrainien

Espagnol

Hindi

Grec

Turc

Japonais

Mandarin

Hébreux

Et plus
Informations techniques
Comment développer avec notre ASR ?
– Sur l’appareil
La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.
– Hybride
Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.
L’ASR que nous proposons est basé sur la reconnaissance de la grammaire. C’est-à-dire que les capacités de la reconnaissance sont basées sur un fichier comprenant différents éléments à reconnaître (nombres, phrases, mots, noms…).
Nos mots déclencheurs supportent non seulement l’édition phonétique (changer le sens du mot pour l’appareil) et la donnée dynamique (flexibilité avec le contenu de la grammaire).
Le systèmes supporte actuellement 41 langues.
– Modèle et taille de ressources : 6 to 15MB
– Taille du code SDK : 10 to 65MB
– Matériel pris en charge : Unités de microprocesseur
– Plateformes supportées :
- Windows – x86_64
- Linux – x86_64 | armv7hf | armv8
- Android 6.0 (API 23)
Technologies Complémentaires
Découvrez les autres technologies de notre stack…

Mot déclencheur
Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.

Biométrie vocale
Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.

Synthèse vocale
Convertissez vos données textuelles en vocaux réalistes en plusieurs langages et voix.

Amélioration audio
Améliorez la qualité du signal audio pour augmenter la précision de la reconnaissance vocale.
C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale
Les Modèles de Langage et ChatGPT
Depuis son lancement en novembre 2022, ChatGPT est un sujet en vogue et a pris une place importante dans la sphère médiatique. De plus en plus de domaines intègrent de grands modèles de langage...

Modèle NLU : les meilleures pratiques pour assurer la précision

L’avenir de l’entreposage : la manutention dirigée par la voix

5 cas d’usages du NLU pour en tirer parti dans vos produits et services

Traitement du Langage Naturel – Ce qui rend une IA « conversationnelle »
