Synthèse vocale (TTS) embarquée, multilingue & personnalisable
Notre logiciel d’intégration de Text-to-Speech TTS permet de produire des voix réalistes en 65 langues pour tout système nomade, embarqué ou mobile.
Pour se familiariser avec le TTS
Qu’est-ce que le TTS (Text-to-Speech) ?
Le Text-to-Speech (ou TTS, synthèse vocale) traduit des textes en voix. Cette technologie s’appuie sur un système de création de voix capable de traduire les graphèmes (données textuelles) en phonèmes (données audio).
Afin de sonner comme une voix humaine, le système s’appuie sur l’apprentissage automatique pour prononcer les mots et phrases de manière appropriée . Avec le SSML (Speech Synthesis Markup Language), la personnalisation va bien plus loin (tonalité, timbre, niveau, vitesse…).
Plus que simplement convertir du texte en voix, ce système, similaire à un synthétiseur vocal, peut devenir une vraie marque de fabrique. C’est la fonctionnalité ultime pour avoir de réelles interactions homme-machine. La personnalisation permet de donner des attributs singuliers à une voix générique.
Notre logiciel permet une utilisation de voix de synthèse totalement embarquée, le produit ou le logiciel final n’a beson d’aucune connexion internet pour fonctionner.
Fonctionnalités
Un Text-to-Speech (TTS) complètement personnalisable
Sélectionnez différentes voix, genres, qualités…
Nous proposons un ensemble hétérogène de voix TTS. Malgré nos origines françaises, notre logiciel ne se limitent pas au français, mais contient plus de 60 langues et plus d’une centaine de voix de différents genres et âges.
La qualité de la voix est aussi importante. Pour répondre à la plupart des exigences matérielles, nous proposons différents niveaux de qualité : de compact à élevé. Cela permet aux utilisateurs de choisir le rapport parfait entre qualité et taille des ressources.
Personnalisez les voix en utilisant le SSML
Le Speech Synthesis Markup Language (SSML) est un langage spécifique utilisé pour modifier le ton, la hauteur, la tonalité, le timbre, la vitesse, l’emphase qui façonnent le rendu du TTS.
Cas d’usage et applications
Comment tirer parti de la synthèse vocale sur le terrain ?
Accessibilité
La synthèse vocale permet de générer du contenu audio pour les utilisateurs et améliore ainsi l’accessibilité.
Conversationel
Produit des voix réalistes pour les assistants vocaux ou les serveurs vocaux interactif (SVI).
Information
La possibilité de fournir des instructions mains-libres ou tout type d’informations en préservant sécurité et concentration.
Expérience
Humanisez n’importe quel produit ou service avec une voix réaliste pouvant être personnalisée avec emphase.
Traduction
Créez un système de traduction speech-to-speech capable de citer à voix haute le contenu traduit.
Annonces
Un système d’annonces flexible et modulaire avec une synthèse vocale pour les services de transport public.
Lancez la révolution vocale de votre entreprise aujourd'hui !
Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.
Bénéfices
Pourquoi choisir notre solution de
synthèse vocale (TTS) ?
Hors connexion
Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.
Empreinte réduite
Une flexibilité de taille de 726kB jusqu’à 580mB en fonction de la qualité.
TTS personnalisé
Ajoutez du SSML (Speech Synthesis Markup Language) pour affiner votre TTS.
Traitement en temps réel
Pas de latence pour un processus d’amélioration de l’audio transparent.
Voix Multilingues
Nous proposons 60 langes et plus de 115 voix parmi lesquelles vous trouverez certainement ce dont vous avez besoin.
Multiplateforme
Simple à développer et à intégrer sur toutes les plateformes (windows, linux, android…).
Pour les développeurs, par des développeurs
Commencez à développer votre solution d'IA vocale avec le VDK
1
Inscrivez-vous sur la Console
Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.
2
Développez et testez
Définissez et créez votre projet pour développer vos fonctionnalités.
3
Partagez votre projet
Partagez votre projet et discutez-en avec nos experts pour une intégration.
Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...
Le support des langues n'est pas un problème
Anglais
Suédois
Indonésien
Thai
Français
Russe
Hollandais
Norvégien
Italien
Portugais
Coréen
Polonais
Allemand
Arabe
Danois
Ukrainien
Espagnol
Hindi
Grec
Turc
Japonais
Mandarin
Hébreux
Et plus
Les entreprises qui ont choisi notre solution
Les retours de nos clients concernant nos technologies
“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”
Guillaume Jégou
Responsable laboratoire Human Factors Technology
"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."
Paul Travers
Directeur général
"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."
Cédric Vincent
VP de la technologie logicielle
Informations techniques
Comment développer avec notre synthèse vocale (TTS) ?
Notre Text-to-speech offre la possibilité de produire des voix réaliste dans plus de 65 langues et voix différentes pour correspondre à vos exigences en matière d’image de marque.
Les voix sont disponibles en différentes qualités :
- Compacte
- Haute
- Premium
- Pro
La qualité compacte est la plus légère, Pro est la plus lourde. En fonction de la taille de vos ressources, la qualité de la voix, son « réalisme » sera impacté.
– Langues : 65
– Taille de ressource :
- Compacte : 1 to 30MB
- Pro : 5 to 100MB
- Haute : 30 to 300MB
- Premium : 40 to 500MB
– Taille du code SDK : from 5MB to 65MB
– Matériel pris en charge : Microprocessor Units
Plateformes supportées :
- Windows – x86_64
- Linux – x86_64 | armv7hf | armv8
- Android 6.0 (API 23)
– Sur l’appareil
La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.
– Hybride
Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.
Technologies Complémentaires
Découvrez les autres technologies de notre stack…
Mot déclencheur
Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.
Reconnaissance vocale
Transforme la parole en données textuelles pouvant être traitées par les machines.
Biométrie vocale
Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.
Amélioration audio
Améliorez la qualité du signal audio pour augmenter la précision de la reconnaissance vocale.
C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale
Mots de réveil pour votre industrie : pourquoi cette technologie est-elle importante pour les services sur le terrain
Dans le secteur des services sur le terrain, les techniciens travaillent souvent dans des endroits éloignés où un accès rapide aux informations, une planification efficace et une communication...