Reconnaissance automatique de la parole hors-ligne

Notre kit de développement logiciel (SDK) permet de donner de la voix à vos produits et services grâce à la reconnaissance automatique de la parole et sa compréhension du vocabulaire complex.

Essayer la technologieEn savoir plus

Pour se familiariser avec l’ASR

La reconnaissance automatique de la parole, aussi connue sous le nom de Speech-to-Text ou juste reconnaissance vocale, est la principale technologie qui fait de la voix un moyen d’interagir.

Au sommet de l’IA vocale, cela rassemble plusieurs solutions comme les modèles acoustiques, le traitement du langage naturel (NLU ou le traitement du signal vocal. C’est cet ensemble qui permet à la reconnaissance vocale de transformer la parole humaine en données normalisées (texte, intention, valeurs…) qui peuvent être traitées par les machines.

Cas d’usages et applications

Comment tirer parti de la reconnaissance automatique
de la parole
sur le terrain ?

Wearables

  • Les lunettes AR à commandes vocales
  • Dictée vocale en VR
  • Casques à contrôle vocal 

Industrie 4.0

  • Picking vocal
  • Dictée vocale pour rapport de terrain 
  • Contrôle qualité à la voix

Électroménager

  • Réfrigérateurs, fours intelligents etc…
  • Éléctronique industrielle mains-libres
  • Assistants vocaux personnalisés

Services de terrain

  • Assistant de maintenance
  • Rapport à la voice
  • Main d’oeuvre assistée par la voix

Robotique

  • Robotique guidée par la voix
  • Outils médicaux mains-libres
  • Interface Homme-Machine

Défense

  • Équipement militaire mains-libres
  • Contrôle vocal pour solutions d’entraînement
  • Maintenances spécifiques

Fonctionnalités

Comment utiliser la reconnaissance de la parole hors-ligne

Reconnaissance par la grammaire

La technologie de reconnaissance basée sur la grammaire est utilisée pour créer des commandes vocales plus précises et fiables. Liée à la dictée vocale, cela permet d’approfondir la solution avec une compréhension de l’intention s’appuyant sur la création de grammaire.

Transcription vocale libre

La transcription vocale est basée sur des modèles d’apprentissage du langage qui sont utilisés pour transformer les signaux audio en texte. Les résultats sont statistiquement déterminés selon la structure de phrase la plus fréquente et l’occurrence de mots en fonction du contexte.

Bénéfices

Hors connexion

Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.

Haute précision

Peu importe l’environnement, la population d’utilisateurs ou la complexité du vocabulaire.

Protection des données

Les données utilisateurs ne sont pas transférées et restent à l’abri des failles de sécurité.

Traitement en temps réel

Pas de latence pour un processus d’amélioration de l’audio transparent.

Maîtrise des coûts

Pas de frais cachés. Nous travaillons avec le modèle d’affaires qui vous convient.

Facile à intégrer

Simple du développement à l’intégration sur toutes les plateformes (windows, linux, android…).

 

Adopter la voix commence ici, avec Vivoka

Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.

Les entreprises qui ont choisi notre solution

Les retours de nos clients concernant nos technologies

“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”

Guillaume Jégou

Responsable laboratoire Human Factors Technology

"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."

Paul Travers

Directeur général

zorabots logo

"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."

Cédric Vincent

VP de la technologie logicielle

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Faites une demande d'essai

Partagez vos informations pour accéder à l'évaluation du VDK.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Exportez et intégrez

Technologies compatibles avec Windows, Android ou Linux.

 

Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...

Le support des langues n'est pas un problème

Anglais

Suédois

Indonésien

Thai

Français

Russe

Hollandais

Norvégien

Italien

Portugais

Coréen

Polonais

Allemand

Arabe

Danois

Ukrainien

Espagnol

Hindi

Grec

Turc

Japonais

Mandarin

Hébreux

Malay

Informations techniques

Comment développer avec notre ASR ?

– Sur l’appareil

La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.

– Hybride

Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.

L’ASR que nous proposons est basé sur la reconnaissance de la grammaire. C’est-à-dire que les capacités de la reconnaissance sont basées sur un fichier comprenant différents éléments à reconnaître (nombres, phrases, mots, noms…).

Nos mots déclencheurs supportent non seulement l’édition phonétique (changer le sens du mot pour l’appareil) et la donnée dynamique (flexibilité avec le contenu de la grammaire).

Le systèmes supporte actuellement 41 langues.

– Modèle et taille de ressources : 6 to 15MB

– Taille du code SDK : 10 to 65MB

– Matériel pris en charge : Unités de microprocesseur

– Plateformes supportées :

  • Windows – x86_64
  • Linux – x86_64 | armv7hf | armv8
  • Android 6.0 (API 23)

Technologies Complémentaires

Découvrez les autres technologies de notre stack…

Mot déclencheur

Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.

Biométrie vocale

Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.

Synthèse vocale

Convertissez vos données textuelles en vocaux réalistes en plusieurs langages et voix.

Amélioration audio

Améliorez la qualité du signal audio pour augmenter la précision de la reconnaissance vocale.

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale