Synthèse vocale (TTS) embarquée, multilingue & personnalisable

Notre logiciel d’intégration de Text-to-Speech TTS permet de produire des voix réalistes en 65 langues pour tout système nomade, embarqué ou mobile.

Essayer la technologiecontact

Pour se familiariser avec le TTS

Qu’est-ce que le TTS (Text-to-Speech) ?

Le Text-to-Speech (ou TTS, synthèse vocale) traduit des textes en voix. Cette technologie s’appuie sur un système de création de voix capable de traduire les graphèmes (données textuelles) en phonèmes (données audio).

Afin de sonner comme une voix humaine, le système s’appuie sur l’apprentissage automatique pour prononcer les mots et phrases de manière appropriée . Avec le SSML (Speech Synthesis Markup Language), la personnalisation va bien plus loin (tonalité, timbre, niveau, vitesse…).

Plus que simplement convertir du texte en voix, ce système, similaire à un synthétiseur vocal, peut devenir une vraie marque de fabrique. C’est la fonctionnalité ultime pour avoir de réelles interactions homme-machine. La personnalisation permet de donner des attributs singuliers à une voix générique. 

Notre logiciel permet une utilisation de voix de synthèse totalement embarquée, le produit ou le logiciel final n’a beson d’aucune connexion internet pour fonctionner. 

Fonctionnalités

Un Text-to-Speech (TTS) complètement personnalisable

Sélectionnez différentes voix, genres, qualités…

Nous proposons un ensemble hétérogène de voix TTS. Malgré nos origines françaises, notre logiciel ne se limitent pas au français, mais contient plus de 60 langues et plus d’une centaine de voix de différents genres et âges.

La qualité de la voix est aussi importante. Pour répondre à la plupart des exigences matérielles, nous proposons différents niveaux de qualité : de compact à élevé. Cela permet aux utilisateurs de choisir le rapport parfait entre qualité et taille des ressources.

Personnalisez les voix en utilisant le SSML

Le Speech Synthesis Markup Language (SSML) est un langage spécifique utilisé pour modifier le ton, la hauteur, la tonalité, le timbre, la vitesse, l’emphase qui façonnent le rendu du TTS.

Exemple SSML : <sub alias="Voice Development Kit">VDK</sub> pour prononcer le mot VDK dans son ensemble au lieu de l’épeler.

Cas d’usage et applications

Comment tirer parti de la synthèse vocale sur le terrain ?

Accessibilité

La synthèse vocale permet de générer du contenu audio pour les utilisateurs et améliore ainsi l’accessibilité.

Conversationel

Produit des voix réalistes pour les assistants vocaux ou les serveurs vocaux interactif (SVI).

Information

La possibilité de fournir des instructions mains-libres ou tout type d’informations en préservant sécurité et concentration.

Expérience

Humanisez n’importe quel produit ou service avec une voix réaliste pouvant être personnalisée avec emphase.

Traduction

Créez un système de traduction speech-to-speech capable de citer à voix haute le contenu traduit.

Annonces

Un système d’annonces flexible et modulaire avec une synthèse vocale pour les services de transport public.

Lancez la révolution vocale de votre entreprise aujourd'hui ! 

Contactez notre équipe pour faire évoluer votre entreprise dans le monde du Voice First.

Bénéfices

Pourquoi choisir notre solution de
synthèse vocale (TTS) ?

Hors connexion

Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.

Empreinte réduite

Une flexibilité de taille de 726kB jusqu’à 580mB en fonction de la qualité.

TTS personnalisé

Ajoutez du SSML (Speech Synthesis Markup Language) pour affiner votre TTS.

Traitement en temps réel

Pas de latence pour un processus d’amélioration de l’audio transparent.

Voix Multilingues

Nous proposons 60 langes et plus de 115 voix parmi lesquelles vous trouverez certainement ce dont vous avez besoin.

Multiplateforme

Simple à développer et à intégrer sur toutes les plateformes (windows, linux, android…).

 

Pour les développeurs, par des développeurs

Commencez à développer votre solution d'IA vocale avec le VDK

1

Inscrivez-vous sur la Console

Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.

2

Développez et testez

Définissez et créez votre projet pour développer vos fonctionnalités.

3

Partagez votre projet

Partagez votre projet et discutez-en avec nos experts pour une intégration.

console by vivoka - demo ar/vr francais

Good morning, Guten Tag, Bonjour, Bom Dia, Buongiorno...

Le support des langues n'est pas un problème

Anglais

Suédois

Indonésien

Thai

Français

Russe

Hollandais

Norvégien

Italien

Portugais

Coréen

Polonais

Allemand

Arabe

Danois

Ukrainien

Espagnol

Hindi

Grec

Turc

Japonais

Mandarin

Hébreux

Et plus

Les entreprises qui ont choisi notre solution

Les retours de nos clients concernant nos technologies

“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”

Guillaume Jégou

Responsable laboratoire Human Factors Technology

"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."

Paul Travers

Directeur général

zorabots logo

"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."

Cédric Vincent

VP de la technologie logicielle

Informations techniques

Comment développer avec notre synthèse vocale (TTS) ?

Notre Text-to-speech offre la possibilité de produire des voix réaliste dans plus de 65 langues et voix différentes pour correspondre à vos exigences en matière d’image de marque.

Les voix sont disponibles en différentes qualités :

  • Compacte
  • Haute
  • Premium
  • Pro

La qualité compacte est la plus légère, Pro est la plus lourde. En fonction de la taille de vos ressources, la qualité de la voix, son « réalisme » sera impacté. 

– Langues : 65

– Taille de ressource :

  • Compacte : 1 to 30MB
  • Pro : 5 to 100MB
  • Haute : 30 to 300MB
  • Premium : 40 to 500MB

– Taille du code SDK : from 5MB to 65MB

– Matériel pris en charge : Microprocessor Units

Plateformes supportées :

  • Windows – x86_64
  • Linux – x86_64 | armv7hf | armv8
  • Android 6.0 (API 23)

– Sur l’appareil

La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.

– Hybride

Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.

Technologies Complémentaires

Découvrez les autres technologies de notre stack…

Mot déclencheur

Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.

Reconnaissance vocale

Transforme la parole en données textuelles pouvant être traitées par les machines.

Biométrie vocale

Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.

Amélioration audio

Améliorez la qualité du signal audio pour augmenter la précision de la reconnaissance vocale.

C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale