`

Reconnaissance Automatique de la Parole

Créez des commandes vocales au vocabulaire complexe grâce à notre technologie intégrée de reconnaissance vocale automatique basée sur la grammaire et Private by Design de notre technologie de reconnaissance automatique de la parole.

Essayer le Voice Development KitNous Contacter

Qu’est-ce que la reconnaissance automatique de la parole ?

La reconnaissance automatique de la parole est une technologie utilisée pour créer des commandes vocales fiables. Étroitement liée à la conversion de la parole en texte, elle permet d’aller plus loin dans la compréhension d’intentions spécifiques grâce à une conception basée sur la grammaire.

Vocabulaire Spécifique

La création de grammaires permet de construire un corpus de mots ou d’expressions complexes et liés au domaine, qui peuvent être reconnus avec une grande précision.

Personnalisation Phonétique

La modification phonétique est le prolongement logique de la création de la grammaire afin d’adapter la manière dont les mots sont censés être reconnus, ce qui permet une plus grande efficacité lors de l’utilisation d’un vocabulaire complexe tel que les noms.

Quelques cas d’usages concrets grâce à la reconnaissance automatique de la parole

La création de commandes vocales intuitives et innovantes est le fondement des interactions vocales. Les possibilités de la reconnaissance automatique de la parole sont infinies pour réinventer les processus et les expériences des utilisateurs avec de la valeur et de la facilité d’utilisation.

Compréhension de mots complexes

Créez des corpus de noms spécifiques et de mots complexes qui seront reconnus par le moteur de reconnaissance automatique de la parole.

Reconnaissance précise des chiffres

La création de grammaires permet d’adapter la manière dont les chiffres sont reconnus par le moteur ASR afin de traiter les références de commande, les numéros de téléphone ou les plaques d’immatriculation.

Commandes vocales fiables

La reconnaissance automatique de la parole permet d’utiliser des commandes vocales pour des tâches liées à l’action (chaîne d’approvisionnement, industrie, maintenance, rapport…) sur lesquelles les utilisateurs peuvent réellement compter.

Une technologie disponible dans le Voice Development Kit

1. Créez votre fichier de grammaire

Commencez par utiliser le widget Grammar Editor du Voice Development Kit pour créer votre propre corpus de vocabulaire et de commandes vocales.

2. Testez et optimisez avec la phonétique

Essayez vos commandes vocales directement sur le widget, en choisissant la bonne langue et en ajustant la reconnaissance avec la modification phonétique.

3. Exportez votre solution et intégrez-la

Lorsque vous obtenez les résultats attendus, vous pouvez exporter votre fichier que vous pourrez intégrer dans votre produit.

Avantages de notre technologie de
reconnaissance automatique de la parole

Reconnaissance vocale multilingue

Notre ASR est capable de travailler avec 36 langues différentes, les plus couramment parlées, y compris leurs dialectes, afin de faire évoluer votre solution dans le monde entier.

Technologie basée sur la grammaire

Cette conception vous permet de définir des mots spécifiques, du jargon commercial et des vocabulaires techniques, tout en vous spécialisant dans la reconnaissance vocale pour des cas d’utilisation prédéfinis.

Solution embarquée à faible empreinte

En fonction des spécifications de votre matériel, l’intégration de notre système de reconnaissance vocale automatique peut se faire de manière transparente grâce à des modèles légers basés sur la grammaire.

Privacy by Design

Comme elle est embarquée, notre solution est privée de par sa conception, les données vocales ne sont pas transférées lors de l’utilisation du moteur de reconnaissance vocale automatique…

Essayez notre technologie avec le Voice Development Kit

 

Le but de ce formulaire est avant tout d’apprendre à vous connaître afin de vous proposer la meilleure configuration de test pour vos besoins.

Si nous déterminons que votre cas d’utilisation est approprié, un de nos consultants vous contactera pour commencer la période d’évaluation.

Vos informations sont conservées dans notre base de données et ne seront utilisées que pour vous contacter dans le cadre de cette évaluation.

 

 

12 + 1 =

Votre projet n’a jamais été aussi proche de sa solution !

En parcourant nos projets et nos technologies, vous avez pu vous faire une idée des possibilités qui s’offrent à vous en travaillant avec nous. Nous pouvons vous aider à atteindre vos objectifs.

Ports et outils standard

  • Android (version 6.0 API 23)
  • Linux: x86_64, armv7hf, armv8
  • Windows: x86_64

 

Taille du code de fonctionnalité

  • Application de base de commande et de contrôle (C&C): 3.2MB
  • Fonctionnalité complète, les plus grands modèles acoustiques: 9.5MB

 

Composants et taille relative des données par langue

  • Modèles acoustiques, par langue
    • Gen 4 compact: 900kB
    • Gen 5: approx. 4MB
    • Gen 6: approx. 6MB
  • GLIC – monolingue – Transcriptions à usage général: 300-7300kB
  • GLC – multilingue – Compilation d’une collection de musique: 700-3000kB

 

Composants et taille relative des données par langue et utilisation totale de la RAM

 

  • Reconnaissance de chiffres: 4kB / 1,25MB
  • Applique basique C&C 100/10,000 commands: 10-500kB / 1,3-1,8MB
  • Téléphonie (numérotation à commande vocale) avec grammaires + SLMs, y compris NLU. 1350 contacts: 0,52MB / 12,6MB
  • Entrée de destination vocale en une seule fois POI et adresses (UDE) tous les États-Unis, basée sur la TSF, y compris l’UAL.: 300MB / 56 MB
  • Dictée vocale embarquée: 100MB / 100MB

 

Spécifications techniques

Notre solution ASR est une technologie embarquée qui est faite pour être intégrée dans des appareils. Pour ce faire, ces produits doivent répondre à des critères spécifiques pour gérer la technologie et la faire fonctionner correctement afin de répondre à votre cas d’utilisation.

Questions fréquemment posées sur la reconnaissance automatique de la parole

Quelques petites choses à savoir…

Les technologies vocales sont en général des solutions complexe. Nous abordons certains des sujets récurrents à afin de vous donner le maximum d’informations.

u
La solution peut-elle comprendre les lettres et les chiffres ?

Notre solution peut en effet identifier des lettres et des chiffres séparés lorsqu’ils sont orthographiés, par exemple une plaque d’immatriculation ou une référence client.

u
Est-elle capable de reconnaître un vocabulaire spécifique ?

La conception de notre solution est pensée pour comprendre un vocabulaire très spécifique grâce à la création de grammaires spécialisées.

u
Quelles sont les spécifications techniques pour l'intégration ?

Les spécifications de la reconnaissance automatique de la parole sont essentielles pour son intégration. Pour avoir accès à ces informations, veuillez nous contacter.

u
La reconnaissance automatique de la parole peut-elle fonctionner dans des environnements bruyants ?

La solution peut fonctionner dans des environnements très bruyants si le microphone est adapté aux conditions de bruit (par exemple dans les usines).

u
Quel type de microphone est le plus adapté à l'écoute ?

La meilleure façon de trouver un microphone adapté est de nous contacter afin de tester différentes alternatives selon votre cas.

u
Quel est le taux d'erreur moyen de cette technologie ?

Le WER (Word Error Rate) de notre technologie dépend de la complexité des requêtes et de la qualité du matériel d’écoute.

D’autres technologies à découvrir…

Front End Audio

Évaluation du signal vocal et filtres pour améliorer la qualité audio des solutions liées à la voix

Text-to-Speech

Génération automatique de voix naturelles multilingues fonctionnant hors ligne sur appareil

Mot Clé Déclencheur

Outil facile pour générer des wake-up words multilingues pour activer vocalement n’importe quel appareil

Biométrie Vocale

Modèles biométriques vocaux hors ligne (in)dépendants du texte pour authentifier/identifier les utilisateurs