Reconnaissance automatique de la parole hors-ligne

Notre kit de développement logiciel (SDK) permet de donner de la voix à vos produits et services grâce à la reconnaissance automatique de la parole et sa compréhension du vocabulaire complex.

Essayer la technologieContact

Pour se familiariser avec l’ASR

La reconnaissance automatique de la parole, aussi connue sous le nom de Speech-to-Text ou juste reconnaissance vocale, est la principale technologie qui fait de la voix un moyen d’interagir.

Au sommet de l’IA vocale, cela rassemble plusieurs solutions comme les modèles acoustiques, le traitement du langage naturel (NLU ou le traitement du signal vocal. C’est cet ensemble qui permet à la reconnaissance vocale de transformer la parole humaine en données normalisées (texte, intention, valeurs…) qui peuvent être traitées par les machines.

Avec la parole transformée en texte, l’objectif est de donner des commandes vocales à une machine, une manière de la contrôler vocalement. La voix est le moyen naturel d’interagir entre humains. Cette technologie permet également d’utiliser la parole pour interagir avec la technologie, donc avec les machines (interaction homme-machine / IHM).

Cas d’usages et applications

Comment tirer parti de la reconnaissance automatique
de la parole
sur le terrain ?

Wearables

  • Les lunettes AR à commandes vocales
  • Dictée vocale en VR
  • Casques à contrôle vocal 

Industrie 4.0

  • Picking vocal
  • Dictée vocale pour rapport de terrain 
  • Contrôle qualité à la voix

Électroménager

  • Réfrigérateurs, fours intelligents etc…
  • Éléctronique industrielle mains-libres
  • Assistants vocaux personnalisés

Services de terrain

  • Assistant de maintenance
  • Rapport à la voice
  • Main d’oeuvre assistée par la voix

Robotique

  • Robotique guidée par la voix
  • Outils médicaux mains-libres
  • Interface Homme-Machine

Défense

  • Équipement militaire mains-libres
  • Contrôle vocal pour solutions d’entraînement
  • Maintenances spécifiques

Fonctionnalités

Comment utiliser la reconnaissance de la parole hors-ligne

Reconnaissance par la grammaire

La technologie de reconnaissance basée sur la grammaire est utilisée pour créer des commandes vocales plus précises et fiables. Si tout est correctement programmé, les utilisateurs savent exactement quelle réponse ils obtiendront pour quelle commande. Chaque mot prononcé par les utilisateurs qui n’est pas dans la configuration du logiciel ne sera pas compris par la machine et l’action ne sera pas exécutée.

Transcription vocale libre

La reconnaissance vocale convertit les mots pronnoncés en texte, non poncctué. Associée à la compréhension du langage naturel (NLU), la machine comprend l’intention qui se cache derrière une commande vocale. Il n’est pas nécessaire qu’elle corresponde strictement aux mots qui ont été définis pour la commande. C’est un premier pas vers l’intelligence artificielle.

Bénéfices

Hors connexion

Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.Notre technologie est complètement embarquée.

Haute précision

Adieu le clavier, la voix est le moyen le plus précis d’interagir avec une machine. Peu importe la complexité du vocabulaire ou les environnements.

Protection des données

Les données utilisateurs ne sont pas transférées et restent à l’abri des failles de sécurité.

Traitement en temps réel

Pas de latence pour un processus d’amélioration de l’audio transparent.

Maîtrise des coûts

Pas de frais cachés. Nous travaillons avec le modèle d’affaires qui vous convient.

Facile à intégrer

Simple du développement à l’intégration sur toutes les plateformes (windows, linux, android…).

 

Lancez la révolution vocale de votre entreprise aujourd'hui ! 

Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.

Les entreprises qui ont choisi notre solution

Les retours de nos clients concernant nos technologies

“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”

Guillaume Jégou

Responsable laboratoire Human Factors Technology

"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."

Paul Travers

Directeur général

zorabots logo

"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."

Cédric Vincent

VP de la technologie logicielle

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Inscrivez-vous sur la Console

Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Partagez votre projet

Partagez votre projet et discutez-en avec nos experts pour une intégration.

console by vivoka - demo ar/vr francais

Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...

Le support des langues n'est pas un problème

Anglais

Suédois

Indonésien

Thai

Français

Russe

Hollandais

Norvégien

Italien

Portugais

Coréen

Polonais

Allemand

Arabe

Danois

Ukrainien

Espagnol

Hindi

Grec

Turc

Japonais

Mandarin

Hébreux

Et plus

Informations techniques

Comment développer avec notre ASR ?

– Sur l’appareil

La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.

– Hybride

Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.

L’ASR que nous proposons est basé sur la reconnaissance de la grammaire. C’est-à-dire que les capacités de la reconnaissance sont basées sur un fichier comprenant différents éléments à reconnaître (nombres, phrases, mots, noms…).

Nos mots déclencheurs supportent non seulement l’édition phonétique (changer le sens du mot pour l’appareil) et la donnée dynamique (flexibilité avec le contenu de la grammaire).

Le systèmes supporte actuellement 41 langues.

– Modèle et taille de ressources : 6 to 15MB

– Taille du code SDK : 10 to 65MB

– Matériel pris en charge : Unités de microprocesseur

– Plateformes supportées :

  • Windows – x86_64
  • Linux – x86_64 | armv7hf | armv8
  • Android 6.0 (API 23)

Notre technologie de reconnaissance vocale s’appuie sur une intelligence artificielle de pointe pour offrir des capacités de reconnaissance vocale inégalées.

Choisissez notre logiciel de reconnaissance pour bénéficier de la meilleure expérience en matière de reconnaissance vocale. Qu’il s’agisse de transcription de mots parlés, de commandes vocales ou de saisie vocale, notre ASR (automatic speech recognition) se distingue sur le marché.

Explorez nos solutions dès aujourd’hui et découvrez comment notre technologie de reconnaissance vocale peut transformer vos flux de travail et améliorer votre productivité.

Technologies Complémentaires

Découvrez les autres technologies de notre stack…

Mot déclencheur

Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.

Biométrie vocale

Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.

Synthèse vocale

Convertissez vos données textuelles en vocaux réalistes en plusieurs langages et voix.

Amélioration audio

Améliorez la qualité du signal audio pour augmenter la précision de la reconnaissance vocale.

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale