`

Synthèse Vocale Embarquée (TTS)

Moteur intégré pour produire une synthèse vocale (text-to-speech) en temps réel afin de vocaliser vos cas d’usages avec des voix naturelles.

Essayer le Voice Development KitNous Contacter

Qu’est-ce que la synthèse vocale ?

Le synthèse vocale, également connue sous le nom de Text-to-Speech ou Text-to-Voice, est une technologie utilisée pour créer une voix en temps réel afin de dicter un texte configuré. Ces voix de synthèse peuvent être sélectionnées en fonction de la langue, du genre et de la qualité.

Personnalisation

Le langage humain présente de nombreuses particularités qui le rendent aussi riche que complexe. Pour produire le langage humain le plus précis possible, des paramètres tels que la hauteur, la vitesse, la puissance, l’émotion et la prononciation des mots peuvent être personnalisés.

Feedbacks vocaux et naturels

La synthèse vocale est un élément clé des interfaces vocales en raison de son rôle de feedback dans l’interaction homme-machine. Dans le cadre de l’amélioration de l’expérience utilisateur, la synthèse vocale est un excellent outil pour améliorer l’accessibilité des services et des produits pour les personnes malvoyantes.

Des cas d’usages concrets grâce à la synthèse vocale (TTS)

La synthèse vocale est l’autre extrémité des interactions vocales, donnant à l’IA conversationnelle la capacité de répondre aux utilisateurs avec des voix semblables à celles des humains. Les applications sont infinies, tout comme les avantages, de l’image de marque à l’expérience utilisateur.

Expérience utilisateur vocale

Créez des interactions humaine avec les assistants vocaux en leur donnant une voix naturelle pour répondre et interagir avec les utilisateurs.

Système d'information vocal

Utilisez la synthèse vocale pour générer des voix personnalisées afin de fournir aux clients ou aux utilisateurs des informations vocales en plus des affichages traditionnels.

Accessibilité vocale

Rendez vos produits et services accessibles à tous, y compris aux malvoyants grâce à la synthèse vocale naturelle.

Une technologie disponible dans le Voice Development Kit

1. Choisissez vos voix et vos langues

Sélectionnez vos voix et langues préférées parmi notre large éventail de ressources (+60 langues, +110 voix) pour répondre à vos attentes en matière d’utilisation.

2. Testez et ajoutez du SSML pour personnaliser les voix

Utilisez des exemples de textes pour essayer différentes voix dans différentes langues afin d’évaluer le meilleur mélange. Personnalisez votre sélection avec du SSML pour modifier le ton, la hauteur, la tonalité, le timbre et plus encore…

3. Sauvegardez et exportez vos voix

Lorsque les résultats attendus sont atteints, sauvegardez vos voix et exportez-les afin de les intégrer dans vos produits et dispositifs.

Langues disponibles

Nos technologies vocales sont disponibles dans plus de 65 langues (et 200 voix différentes) afin de donner la voix à vos produits et services partout où vous souhaitez les déployer dans le monde.

Anglais (US)

Anglais (UK)

Français

Espagnol

Allemand

Japonais

Mandarin

Hindi

Coréen

Néerlandais

Arabe

Russe

Portugais

Italien

Suédois

Avantages de notre synthèse vocale

Synthèse vocale naturelle multilingue

Notre système de synthèse vocale (TTS) est disponible en 65 langues, ce qui couvre la grande majorité des locuteurs et des besoins afin de vocaliser tous les cas d’utilisation.

De nombreuses voix disponibles

Plus de 100 voix sont disponibles. Elles sont classées par sexe, émotions et qualité pour vous permettre de personnaliser les réponses que vous donnez à vos utilisateurs dans certains contextes.

Voix entièrement personnalisables

De nombreux paramètres sont à votre disposition tels que la hauteur, la vitesse, la puissance, l’émotion, les prononciations… afin d’adapter davantage la voix synthétique à son contexte.

Moteur de synthèse vocale léger

Selon la qualité de la voix, la capacité de stockage requise peut varier considérablement. Cela permet de construire des TTS pour des appareils de faible puissance jusqu’à des systèmes beaucoup plus puissants.

Développez votre solution vocale dès maintenant !

Accédez au Voice Development Kit pour commencer la création de vos solutions vocales d’entreprise.

Veuillez noter que seules les entreprises et les organisations peuvent utiliser notre technologie. L’utilisation individuelle n’est pas encore autorisée.

Merci de votre compréhension.

Votre projet n’a jamais été aussi proche de sa solution !

En parcourant nos projets et nos technologies, vous avez pu vous faire une idée des possibilités qui s’offrent à vous en travaillant avec nous. Nous pouvons vous aider à atteindre vos objectifs.

Ports et outils standard

  • Android (version 6.0 API 23)
  • Linux: x86_64, armv7hf, armv8
  • Windows: x86_64

 

Voice Operating Point (VOP) avec la taille relative de la mémoire flash (sans code) et l’utilisation de la mémoire vive.

  • Embedded Compact – Petit TTS polyvalent adapté aux plates-formes restreintes
    • Flash Size: Ave. 10MB / Max. 21MB
    • RAM Usage: Ave. 6MB / Max. 23MB
  • Embedded Pro – TTS de haute qualité optimisé pour la navigation, la lecture d’informations et les capacités de lecture
    • Flash Size: Ave. 55MB / Max. 131MB
    • RAM Usage: Ave. 14MB / Max. 38MB
  • Embedded High – Lecture TTS de haute qualité pour les SMS, les nouvelles, les e-mails sur des cibles intégrées
    • Flash Size: Ave. 120MB / Max. 325MB
    • RAM Usage: Ave. 24MB / Max. 69MB
  • Embedded Premium – Synthèse concaténative de très haute qualité basée sur l’apprentissage profond, voix sélectionnée uniquement
    • Flash Size: Ave. 337MB / Max. 558MB
    • RAM Usage: Ave. 159MB / Max. 198MB

Les voix multilingues comprennent du matériel enregistré pour une ou plusieurs langues étrangères. Elles sont disponibles pour tous les points d’exploitation, à l’exception d’Embedded Compact, et nécessitent jusqu’à 50 % de mémoire supplémentaire (flash et RAM) par rapport aux chiffres ci-dessus.

Spécifications techniques

Notre solution de synthèse vocale est une technologie embarquée qui est faite pour être intégrée dans des appareils. Pour ce faire, ces produits doivent répondre à des critères spécifiques pour gérer la technologie et la faire fonctionner correctement pour réaliser votre cas d’utilisation.

Questions fréquemment posées sur
la synthèse vocale

Quelques éléments à savoir…

La synthèse vocale est une technologie bien connue, mais pas par tout le monde. Nous couvrons certains des sujets récurrents à son sujet afin de vous donner un aperçu.

u
Est-il possible de personnaliser la voix générée à partir du moteur TTS ?

Plusieurs paramètres peuvent être modifiés directement tels que la hauteur, la vitesse, la puissance, l’émotion ou la prononciation.

u
Les voix synthétiques ont-elles des limites en termes de longueur des mots ?

Vous pouvez produire des textes vocalisés aussi long que vous souhaitez et optimiser le paramètre de la voix pour qu’elle soit naturelle.

u
Quelles sont les spécifications techniques pour l'intégration du Text-to-Speech ?

Les spécifications de synthèse vocale sont essentielles pour son intégration. Pour avoir accès à ces informations, veuillez nous contacter.

u
Y a-t-il un matériel nécessaire pour jouer les voix synthétiques ?

Le Text-to-Speech vous permet de créer des voix dans différentes extensions de fichiers, en particulier les plus populaires (mp3, wav…).

u
Comment produire une voix synthétique qui ne sonne pas "robot" ?

Dans la plupart des cas, la hauteur, la vitesse et les pauses sont en cause. Ces paramètres sont personnalisables avec notre TTS.

u
Le TTS est-il capable de dire des mots spécifiques ou peu courants ?

L’éditeur phonétique vous permet de créer une phonétique personnalisée pour les mots qui pourraient être mal prononcés.

D’autres technologies à découvrir…

Speech-to-Text

Transcription vocale en continu et sur appareil pour transformer la parole en texte écrit

Commandes Vocales (ASR)

Reconnaissance automatique de la parole pour commandes vocales à vocabulaire spécifique

Mot Clé Déclencheur

Outil facile pour générer des wake-up words multilingues pour activer vocalement n’importe quel appareil