Créez un système de reconnaissance vocale embarqué

Le VDK vous permettra d’activer simplement vos produits et services à l’aide de commandes vocales grâce à une solution de reconnaissance vocale automatique (ASR) ultra-précise, évolutive et entièrement embarquée.

Une reconnaissance automatique de la parole ultra précise

La reconnaissance automatique de la parole, souvent appelée Speech-to-Text ou simplement Speech Recognition, est la principale technologie qui fait de la voix un moyen d’interaction. Au sommet de l’IA vocale, elle fusionne des solutions complexes telles que les modèles acoustiques, la compréhension du langage naturel (NLU) ou le traitement du signal audio.

Applications existantes

Comment utiliser la reconnaissance de la parole ?

Wearables

  • Lunettes AR à commande vocale
  • Dactylographie vocale en réalité virtuelle
  • Commande vocale dans les écouteurs

Industrie 4.0

  • Picking vocal
  • Dictée de rapports
  • Contrôle qualité

Électroménager

  • Réfrigérateur, four, etc. intelligents
  • Appareil industriel mains libres
  • Assistant vocal de marque

Services de terrain

  • Assistant de maintenance
  • Rapports vocaux
  • Main-d’œuvre assistée par la voix

Robotique

  • Robotique à commande vocale
  • Outils médicaux mains libres
  • Interface homme-machine

Défense

  • Équipement militaire mains libres
  • Solutions de formation basées sur la voix
  • Flux de travail spécifiques MRO

Combinaison de complexité et de simplicité

De quoi est fait le Voice Development Kit ?

Le Studio, une interface graphique facile à utiliser

Une interface agréable qui permet de tirer parti des capacités du SDK sans les connaissances en codage qu’il implique. Chaque technologie a son widget et un ensemble d’outils pour développer et mettre au point votre solution sur mesure.

Le SDK, un outil de développement puissant pour créer des IA vocales avancées

Un SDK qui rassemble toutes les technologies au sein d’une plateforme d’intégration unique. En combinant R&D et données de terrain, nous avons simplifié la complexité.
La personnalisation va bien au-delà de ce que nous pouvons imaginer.

Exigencees techniques

Spécificités du VDK

Langues 41
Modèle + Taille de ressource 6 – 15MB
SDK Taille du code 10 – 65MB
Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Android 6.0 (API 23)

Matériel pris en charge MPU
Langues 5
Modèle + Taille de ressource 30 – 50MB
Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Android 6.0 (API 23)

Matériel pris en charge MPU

 

Langues 41
Modèle + Taille de ressource 6 – 15MB
SDK taille du code 10 – 65MB
Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Android 6.0 (API 23)

Matériel pris en charge MPU
Langues 65
Modèle + Taille de ressource <1MB up to 500MB per voice depending on the quality
SDK Taille du code 5 – 65MB
Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Android 6.0 (API 23)

Matériel pris en charge MPU
Langues Agnostic
Modèle + Taille de ressource <1MB to 20MB
SDK Taille du code

<1MB = 50KB / User registered

20MB = 5KB / User registered

Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Android 6.0 (API 23)

Matériel pris en charge MPU
Langues Agnostic
Modèle + Taille de ressource None
SDK Taille du code 3MB
Plateformes supportées

Windows – x86_64

Linux – x86_64 | armv7hf | armv8

Matériel pris en charge MPU

Commencez
dès maintenant

Complétez ce formulaire et commencez à expérimenter le VDK avec l’évaluation gratuite !

[contact-form-7 id= »236481″ title= »Formulaire demande éval (FR)_copy champs conditionnels »]

Bénéfices de notre
Reconnaissance
de la parole

Hors connexion

Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.

Haute précision

Peu importe l’environnement, la population d’utilisateurs ou la complexité du vocabulaire.

Protection des données

Les données utilisateurs ne sont pas transférées et restent à l’abri des failles de sécurité.

Traitement en temps réel

Pas de latence pour un processus d’amélioration de l’audio transparent.

Facile à intégrer

Simple du développement à l’intégration sur toutes les plateformes (windows, linux, android…).

 

Maîtrise des coûts

Pas de frais cachés. Nous travaillons avec le modèle d’affaires qui vous convient.

Les entreprises qui ont choisi notre solution

Les retours de nos clients concernant nos technologies

“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”

Guillaume Jégou

Responsable laboratoire Human Factors Technology

"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."

Paul Travers

Directeur général

zorabots logo

"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."

Cédric Vincent

VP de la technologie logicielle

Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...

Le support des langues n'est pas un problème

Anglais

Suédois

Indonésien

Thai

Français

Russe

Hollandais

Norvégien

Italien

Portugais

Coréen

Polonais

Allemand

Arabe

Danois

Ukrainien

Espagnol

Hindi

Grec

Turc

Japonais

Mandarin

Hébreux

Et plus

Créez des interfaces vocales hors ligne
grâce à une technologie vocale de premier plan
qui respecte la vie privée