`

Transcription Vocale (STT)

Transcription vocale continue et multilingue pour transformer des phrases ou des discussions en texte écrit sur la base d’un modèle d’apprentissage automatique.

Essayer le Voice Development KitNous Contacter

Qu’est-ce que la transcription vocale (STT) ?

La transcription vocale (aussi connue comme Speech-to-Text) est une technologie vocale, basée sur des modèles linguistiques d’apprentissage profond, qui est utilisée pour transformer des signaux audio en texte transcrit.

Les résultats sont déterminés statistiquement en ce qui concerne les structures de phrases les plus fréquentes et l’occurrence des mots en fonction du contexte identifié.

Quelques cas d’usages concrets grâce à la transcription vocale

La transcription vocale est la base de la reconnaissance vocale et des assistants vocaux que nous connaissons. Cette technologie est conçue pour être associée à d’autres solutions afin de produire des cas d’usages vocaux innovants.

Transcription vocale

Transcription vocale automatique des discussions et des réunions à traiter comme une dictée vocale avec des modèles de reconnaissance vocale spécifiques.

Commandes vocales

Transformation de la voix en texte qui sera interprété par des moteurs NLP/NLU afin d’identifier l’intention de l’utilisateur pour les commandes vocales.

Systèmes de messagerie vocale

Transcription rapide et automatique de la voix utilisée pour les applications de messagerie sur les appareils.

Une technologie disponible dans le Voice Development Kit

1. Configurez votre moteur Speech-to-Text

Commencez par sélectionner la langue dont vous avez besoin pour votre projet et déterminez la bonne configuration (seuil de confiance par exemple).

2. Chargement de l’audio ou enregistrement sur le VDK

Branchez votre microphone et commencez à parler ou téléchargez vos fichiers audio pour transcrire leur contenu en texte et évaluez la solution qui fonctionne le mieux.

3. Analysez les résultats, optimisez et intégrez

La transcription de la parole en texte sera fournie dans différentes hypothèses (dont le nombre peut être modifié) afin de vous aider à optimiser le seuil de confiance pour une intégration ultérieure.

Langues disponibles

Nos technologies vocales sont disponibles dans plus de 40 langues afin de donner la voix à vos produits et services partout où vous souhaitez les déployer dans le monde.

Anglais (US)

Anglais (UK)

</