+33 (0)9 71 00 03 70 contact@vivoka.com

Solution Vocale Embarquée – Voice Development Kit

Créez votre solution vocale embarquée ou autre fonctionnalité basée sur la voix avec notre kit de développement logiciel (SDK) spécialisé. Cette solution hors-ligne contient la reconnaissance et la synthèse vocale  ainsi que de nombreuses autres technologies pour vous aider à développer plus rapidement et plus facilement.

Le premier kit de développement (SDK) pour solution vocale embarqué

 

Le Voice Development Kit (VDK) est un kit de développement logiciel multifonction, combiné à une interface graphique intuitive, spécialisé dans les solutions vocales embarquées. Il permet à toute entreprise et à tout développeur de configurer un assistant vocal embarqué composé d’une ou plusieurs technologies vocales hors ligne (transcription, synthèse, gestion de la grammaire…) en un temps record.

La complexité inhérente aux technologies et aux plugins associés a été abstraite et optimisée par notre savoir-faire obtenu au cours de 5 années de projets et d’ingénierie.

Les technologies intégrées dans le kit de développement vocal proviennent de notre R&D ainsi que de nos partenaires, afin de garantir la meilleure polyvalence à nos clients.

Toutes les technologies nécessaires dans une solution logicielle unique avec interface graphique

Plus de 60 langues disponibles fonctionnant hors ligne (Private by Design)

Une interface utilisateur intuitive

Une solution tout en un

De nombreux plugins doivent être utilisés en parallèle pour réaliser la création de fonctionnalités vocales. Avec le VDK, tout est sur le même logiciel et la même interface dans une vue. Accédez à toutes les solutions vocales embarquées et aux outils puissants très simplement.

Des flux de travail simplifiés

Les processus de développement ont été repensés par le VDK. Du réglage de la grammaire, en passant par le code, jusqu’à la phase de test et d’intégration, tout se passe sur l’interface du VDK. De plus, tous les outils fonctionnent sur le même système d’exploitation.

(Vue du tableau de bord principal du VDK avec les plugins actifs)

Une large gamme de plugins et d’outils intelligents

Simple Assistant Maker

SAM est un outil imaginé et créé par Vivoka pour créer un assistant vocal fonctionnel en un minimum de temps. Ce plugin a besoin d’une commande pour être reconnu, d’une réponse pour être donné et d’un script pour être exécuté pour fonctionner. Toutes les commandes sont testables en temps réel.

Customization modules

Rédacteur de grammaire, rédacteur de COPFile, Voice Studio… Tous ces outils sont à votre disposition pour les différentes étapes de la création des fonctionnalités vocales embarquées : création de vocabulaires reconnus, personnalisation des voix de synthèse, gestion des fichiers dynamiques…

(Vue des plugins dont les voix disponibles pour la synthèse vocale)

Des tutoriels et une documentation claire

Tutoriels détaillés

Il est souvent compliqué de s’y retrouver dans les premières étapes de la création d’une interface vocale. Pour réduire cette complexité, des tutoriels (création d’un ASR, d’un TTS…) sont disponibles pour vous accompagner pas à pas dans le développement de votre solution vocale embarquée.

Codes exemples et doc

Les cas d’usages les plus populaires sont associés à des exemples de codes pour faciliter la création de ces derniers. Pour les cas plus complexes, une documentation complète et nos services sont disponibles via la plateforme Voice Development Kit.

(Simple Assistant Maker et fenêtre de tutoriel ouverte sur la droite)

Rentable

Voice Development Kit est capable de produire une solution vocale embarquée en un temps record, réduisant ainsi les coûts en ressources humaines.

Time-to-Market

Avec une conception, un développement et des tests plus rapides, vous réduisez le temps nécessaire pour produire une solution opérationnelle.

État de l'art

Voice Development Kit fournit les meilleures technologies embarquées/hors ligne actuelles, issues de notre R&D et des solutions de nos partenaires.

Multilingue

Plus de 60 langues sont disponibles (ASR, TTS, Wake Word…) pour configurer vos fonctionnalités vocales embarquées en fonction de vos utilisateurs.

Private by Design

Voice Development Kit est un logiciel de développement vocal entièrement hors ligne. Toutes ses technologies fonctionnent sans connexion Internet.

Faible utilisation du CPU

Nos technologies embarquées sont conçues pour fonctionner sur des systèmes embarqués avec peu de ressources disponibles.

Quelques entreprises qui ont choisi le kit de développement de la voix pour leur solution vocale embarquée

Depuis sa création, le Voice Development Kit a convaincu de nombreux acteurs dans divers secteurs d’activité. Afin de refléter au mieux leur inventivité et la performance de notre outil, nous réalisons des études de cas.

Votre projet n’a jamais été aussi proche de sa solution !

En parcourant nos projets et nos technologies, vous avez peut-être pu vous faire une idée des possibilités que vous avez en travaillant avec nous. Nous pouvons également vous aider à atteindre vos objectifs.

Systèmes d’exploitations pour la plateforme SDK embarquée

  • Windows: 32-bit et 64-bit
  • Linux x86: 32-bit et 64-bit

 

 

Liaison et conditionnement des API en fonction du système d’exploitation

  • Android: ASR (dans VDK) sera servi avec une liaison Java-API compilée dans une archive Android (AAR)
  • Win/Linux: ASR (dans VDK) sera livré avec une liaison API C++
  • Apple iOS: ASR (au sein de VDK) sera livré avec une liaison Swift

 

Ports et outils standard

  • iOS (version 7.0 et supérieure): arm64 et x86_64
  • Android (version 5.0 et supérieure): armv7 (32Bit), arm64 et x86_64
  • Linux: armv7 (32Bit), arm64 et x86_64
  • Windows: x86_64

 

Taille du code de fonctionnalité

  • Application de base de commande et de contrôle (C&C): 3.2MB
  • Fonctionnalité complète, les plus grands modèles acoustiques: 9.5MB

 

Composants et taille relative des données par langue

  • Modèles acoustiques, par langue
    • Gen 4 compact: 900kB
    • Gen 5: approx. 4MB
    • Gen 6: approx. 6MB
  • GLIC – monolingue – Transcriptions à usage général: 300-7300kB
  • GLC – multilingue – Compilation d’une collection de musique: 700-3000kB

 

Composants et taille relative des données par langue et utilisation totale de la RAM

  • Reconnaissance de chiffres: 4kB / 1,25MB
  • Applique basique C&C 100/10,000 commands: 10-500kB / 1,3-1,8MB
  • Téléphonie (numérotation à commande vocale) avec grammaires + SLMs, y compris NLU. 1350 contacts: 0,52MB / 12,6MB
  • Entrée de destination vocale en une seule fois POI et adresses (UDE) tous les États-Unis, basée sur la TSF, y compris l’UAL.: 300MB / 56 MB
  • Dictée vocale embarquée: 100MB / 100MB

Logiciel d’exploitation pour la plate-forme SDK embarquée

  • Windows: 32-bit and 64-bit
  • Linux x86: 32-bit and 64-bit

Ports et outils standard

  • Linux ARM: ARM32 Hardfp, ARM32 Softfp, ARM64
  • Android v4.0 (Ice Cream Sandwich), API level 14+, ARM32-v7a Android v7.0 (Nougat), API level 24+, ARM64-v8a
  • iOS: arm64, armv7, armv7s, i386 and x86_64 simulator

La taille du code d’un moteur TTS embarqué complet est de 10 à 13,5 Mo selon la plate-forme cible. Ce code peut être optimisé en fonction du jeu de langage requis, des fonctionnalités et du choix du compilateur.

 

Voice Operating Point (VOP) avec la taille relative de la mémoire flash (sans code) et l’utilisation de la mémoire vive.

  • Embedded Compact – Petit TTS polyvalent adapté aux plates-formes restreintes
    • Flash Size: Ave. 10MB / Max. 21MB
    • RAM Usage: Ave. 6MB / Max. 23MB
  • Embedded Pro – TTS de haute qualité optimisé pour la navigation, la lecture d’informations et les capacités de lecture
    • Flash Size: Ave. 55MB / Max. 131MB
    • RAM Usage: Ave. 14MB / Max. 38MB
  • Embedded High – Lecture TTS de haute qualité pour les SMS, les nouvelles, les e-mails sur des cibles intégrées
    • Flash Size: Ave. 120MB / Max. 325MB
    • RAM Usage: Ave. 24MB / Max. 69MB
  • Embedded Premium – Synthèse concaténative de très haute qualité basée sur l’apprentissage profond, voix sélectionnée uniquement
    • Flash Size: Ave. 337MB / Max. 159MB
    • RAM Usage: Ave. 558MB / Max. 198MB

Les voix multilingues comprennent du matériel enregistré pour une ou plusieurs langues étrangères. Elles sont disponibles pour tous les points d’exploitation, à l’exception d’Embedded Compact, et nécessitent jusqu’à 50 % de mémoire supplémentaire (flash et RAM) par rapport aux chiffres ci-dessus.

 

Exigences techniques

Le Voice Development Kit est un logiciel pour technologie vocale hors ligne (embarquée) conçu pour être intégré dans des appareils. Pour ce faire, ces produits doivent répondre à des critères spécifiques pour traiter les solutions du VDK et les faire fonctionner correctement pour réaliser vos cas d’usages.

Questions fréquemment posées sur le VDK

Quelques petites choses à savoir…

Le kit de développement de la voix peut être un logiciel complexe à comprendre et à adopter. Nous abordons certains des sujets récurrents à son sujet afin de vous donner un aperçu.

u
Combien de langues sont disponibles dans le Voice Development Kit ?

30+ pour ASR et Wake Word, 50+ pour TTS. Si vous souhaitez obtenir la liste complète des langues, veuillez nous contacter

u
Quels sont les langages de programmation utilisés pour développer avec le VDK ?

Pour nom, les principaux langages disponibles sont C++. Pour les appareils mobiles, Java (Android) et Swift (iOS) doivent être utilisés

u
Quelles sont les spécifications techniques pour l'intégration des technologies du VDK ?

Les spécifications du VDK sont essentielles pour l’intégration de ses technologies. Pour avoir accès à ces informations, veuillez nous contacter

u
Y a-t-il un accès à la documentation et une aide pour utiliser les outils ?

Une documentation complète est disponible avec l’interface du VDK. De nombreux tutoriels sont également à votre disposition pour vous aider.

u
Fournissez-vous un soutien et une formation à nos équipes techniques ?

Nos experts peuvent vous fournir un soutien complet pour vous aider à construire vos projets. Les connaissances partagées restent avec vous.

u
Y a-t-il un intérêt à utiliser le VDK pour une seule solution vocale embarquée ?

Le VDK est conçu pour être accélérer et simplifier l’utilisation et le développement des technologies vocales, seules ou combinées

D’autres technologies à découvrir

Speech to Text

Technologie utilisée pour transformer automatiquement la voix en texte

Synthèse vocale embarquée

Génération automatique de voix naturelles multilingues qui fonctionne hors ligne sur l’appareil

Mot déclencheur embarqué

Outil facile pour générer un mot déclencheur multilingue à intégrer dans les appareils