`

Transcription Vocale (STT)

Transcription vocale continue et multilingue pour transformer des phrases ou des discussions en texte écrit sur la base d’un modèle d’apprentissage automatique.

Essayer le Voice Development KitNous Contacter

Qu’est-ce que la transcription vocale (STT) ?

La transcription vocale (aussi connue comme Speech-to-Text) est une technologie vocale, basée sur des modèles linguistiques d’apprentissage profond, qui est utilisée pour transformer des signaux audio en texte transcrit.

Les résultats sont déterminés statistiquement en ce qui concerne les structures de phrases les plus fréquentes et l’occurrence des mots en fonction du contexte identifié.

Quelques cas d’usages concrets grâce à la transcription vocale

La transcription vocale est la base de la reconnaissance vocale et des assistants vocaux que nous connaissons. Cette technologie est conçue pour être associée à d’autres solutions afin de produire des cas d’usages vocaux innovants.

Transcription vocale

Transcription vocale automatique des discussions et des réunions à traiter comme une dictée vocale avec des modèles de reconnaissance vocale spécifiques.

Commandes vocales

Transformation de la voix en texte qui sera interprété par des moteurs NLP/NLU afin d’identifier l’intention de l’utilisateur pour les commandes vocales.

Systèmes de messagerie vocale

Transcription rapide et automatique de la voix utilisée pour les applications de messagerie sur les appareils.

Une technologie disponible dans le Voice Development Kit

1. Configurez votre moteur Speech-to-Text

Commencez par sélectionner la langue dont vous avez besoin pour votre projet et déterminez la bonne configuration (seuil de confiance par exemple).

2. Chargement de l’audio ou enregistrement sur le VDK

Branchez votre microphone et commencez à parler ou téléchargez vos fichiers audio pour transcrire leur contenu en texte et évaluez la solution qui fonctionne le mieux.

3. Analysez les résultats, optimisez et intégrez

La transcription de la parole en texte sera fournie dans différentes hypothèses (dont le nombre peut être modifié) afin de vous aider à optimiser le seuil de confiance pour une intégration ultérieure.

Langues disponibles

Nos technologies vocales sont disponibles dans plus de 40 langues afin de donner la voix à vos produits et services partout où vous souhaitez les déployer dans le monde.

Anglais (US)

Anglais (UK)

Français

Espagnol

Allemand

Japonais

Mandarin

Hindi

Coréen

Néerlandais

Arabe

Russe

Portugais

Italien

Suédois

Avantages de notre transcription vocale

Transcription vocale sans contrainte

Le transcription vocale donne à l’utilisateur la possibilité d’interagir vocalement avec n’importe quel produit et service sans les restrictions de vocabulaire que d’autres solutions peuvent imposer.

Apprentissage automatique précis

Le faible Word Error Rate (WER) est obtenu grâce à un modèle d’apprentissage automatique de pointe qui fournit des hypothèses de résultats pouvant être suivies pour améliorer la reconnaissance du système.

Solution embarquée à faible empreinte

Le fonctionnement de notre STT occupe une charge minimale de l’unité centrale. Cette capacité provient de sa conception innovante et de la taille réduite des modèles d’apprentissage automatique.

Privacy by Design

Les solutions embarquées ont la capacité de fonctionner sans connexion internet ou autres services. En évitant les transferts de données, une solution embarquée devient privée de par sa conception même.

Développez votre solution vocale dès maintenant !

Accédez au Voice Development Kit pour commencer la création de vos solutions vocales d’entreprise.

Veuillez noter que seules les entreprises et les organisations peuvent utiliser notre technologie. L’utilisation individuelle n’est pas encore autorisée.

Merci de votre compréhension.

Votre projet n’a jamais été aussi proche de sa solution !

En parcourant nos projets et nos technologies, vous avez pu vous faire une idée des possibilités qui s’offrent à vous en travaillant avec nous. Nous pouvons vous aider à atteindre vos objectifs.

Ports et outils standard

  • Android (version 6.0 API 23)
  • Linux: x86_64, armv7hf, armv8
  • Windows: x86_64

 

Taille des ressources

  • Entre 250 et 300MB


Taille du SDK

  • Environ 50MB

 

Spécifications techniques

Notre solution Speech-to-Text est une technologie embarquée qui est faite pour être intégrée dans des appareils. Pour ce faire, ces produits doivent répondre à des critères spécifiques pour gérer la technologie et la faire fonctionner correctement afin de répondre à votre cas d’utilisation.

Questions fréquemment posées sur
la transcription vocale

Quelques éléments à savoir…

La transcription vocale peut être délicate car il s’agit d’une technologie complexe. Nous couvrons certains des sujets récurrents à ce sujet afin de vous donner un aperçu.

u
Le STT peut-il comprendre les lettres et les chiffres épelés ?

Notre STT peut en effet identifier des lettres et des chiffres séparés lorsqu’ils sont épelés, par exemple une plaque d’immatriculation ou une référence client.

u
Le Speech-to-Text est-il capable de reconnaître un vocabulaire spécifique ?

Oui, si elle est associée à une solution NLP/NLU (Natural Language Processing/Understanding) spécifique. Sinon, vous devriez essayer notre ASR basé sur la grammaire.

u
Quelles sont les spécifications techniques pour intégrer le STT ?

Les spécifications de la STT sont essentielles pour son intégration. Pour avoir accès à ces informations, veuillez nous contacter.

u
La transcription vocale peut-elle fonctionner dans des environnements bruyants ?

La transcription vocale peut fonctionner dans des environnements très bruyants si le microphone est adapté aux conditions de bruit (par exemple, dans les usines).

u
Quel type de microphone est le plus adapté à l'écoute ?

Il existe des dispositifs audio adaptés au STT. Le meilleur moyen de trouver un microphone adapté est de nous contacter afin de tester différentes alternatives.

u
Quel est le taux d'erreur moyen de votre technologie STT ?

Le WER (Word Error Rate) de notre STT dépend de la complexité du texte et de la qualité du matériel. Contactez-nous pour des informations plus personnalisées.

D’autres technologies à découvrir…

Commandes Vocales (ASR)

Reconnaissance automatique de la parole pour commandes vocales à vocabulaire spécifique

Text-to-Speech

Génération automatique de voix naturelles multilingues fonctionnant hors ligne sur appareil

Mot Clé Déclencheur

Outil facile pour générer des wake-up words multilingues pour activer vocalement n’importe quel appareil.

Biométrie Vocale

Modèles biométriques vocaux hors ligne (in)dépendants du texte pour authentifier/identifier les utilisateurs