Déjà client ?
Notre équipe support vous accompagne dans votre migration vers le VDK 6
Pourquoi passer au VDK 6 ?
Plateforme Open Voice AI

L’IA vocale embarquée,
pour les applications métier

La suite complète pour développer des projets d’IA vocale évolutifs, grâce à une plateforme de développement qui réunit Console, Studio, Developer Toolbox et Runtime.
Créez des solutions vocales sur mesure et des workflows pilotés par la voix, fonctionnant hors ligne sur tout type de matériel, avec un contrôle total sur vos données et votre déploiement.

6
Technologies vocales
65+
Langues
100 % hors ligne et embarqué
Fonctionne sans connexion Internet
Compatible avec tout type de matériel
Déployez sur n’importe quel appareil ou plateforme
Entièrement personnalisable
Adaptez la solution à vos workflows
Technologies vocales
Incluses par défaut dans le VDK 6

6 technologies d’IA vocale

Créez des expériences vocales avancées avec notre suite complète.

Commandes vocales

Contrôle vocal intelligent

Pilotez vos applications métier à la voix et exécutez vos tâches plus rapidement. Les opérateurs terrain et les soignants réduisent les interactions physiques tout en gagnant en productivité.

Prise en charge multilingue
Traitement hors ligne
Réponses contextualisées

Détection du mot déclencheur

Toujours à l’écoute, toujours prêt

Activez l’interface vocale grâce à des mots déclencheurs personnalisés. Toujours active et à faible consommation d’énergie, la détection assure une réponse immédiate. Les anti-mots déclencheurs réduisent les activations accidentelles pour garantir un déclenchement uniquement lorsqu’il est réellement souhaité.

Entraînement de mots déclencheurs personnalisés
Faible consommation d’énergie
Détection haute précision
Filtrage des anti-mots déclencheurs

Synthèse vocale (TTS)

Une voix naturelle et fluide

Diffusez des consignes vocales claires et adaptées aux opérateurs terrain comme aux soignants. Ajustez la vitesse de lecture pour gagner en efficacité, augmentez le volume pour plus de clarté et adaptez la restitution à chaque environnement d’utilisation.

Plus de 65 voix disponibles
18 langues TTS neuronales
Compatible SSML

Biométrie vocale

Authentification vocale sécurisée

Identifiez et authentifiez les utilisateurs à partir de leur empreinte vocale. Garantissez un accès fluide et sécurisé, sans mot de passe ni code PIN.

Authentification de l’utilisateur
Identification de l’utilisateur
Protection contre l’imitation de la voix
Configuration rapide

Amélioration audio

Un traitement audio précis et efficace

Grâce à un traitement avancé du signal, le bruit, l’écho et la réverbération sont réduits pour garantir une qualité audio optimale dans tous les environnements et une reconnaissance plus fiable.

Réduction du bruit
Annulation d’écho
Beamforming
Contrôle du gain

Bientôt disponible

La démo de la technologie de saisie vocale sera bientôt disponible.

Saisie vocale

Une saisie vocale continue et fiable

La parole est convertie en texte en temps réel avec une grande précision. Idéale pour la documentation, le reporting, la prise de notes et les usages de dictée longue.

Saisie vocale continue
Grande précision
Vocabulaire personnalisé
Transcription en temps réel
Voice Error Correction

Une reconnaissance vocale précise en conditions réelles

Vivoka rend la reconnaissance vocale plus précise et plus fiable en conditions réelles, même là où les ASR traditionnels échouent.

L’ASR seul atteint vite ses limites

🔇 Le bruit réduit la précision
🗣️ Les accents augmentent le risque d’erreur
Un débit de parole élevé complique la reconnaissance
⚠️ En contexte métier, la reconnaissance devient moins fiable

Vivoka améliore la précision

🎯 Réduction du bruit grâce à un traitement audio avancé
🌍 Une reconnaissance plus robuste face aux accents
💬 Une reconnaissance plus stable, même lorsque la parole est rapide ou moins nette
📊 Les listes de contexte guident la reconnaissance vers les bonnes séquences
⚙️ Des listes de contexte volumineuses, sans compromis sur les performances

L’impact

77 %
d’erreurs en moins*
*Étude interne sur des cas d’usage alphanumériques en conditions réelles
Des workflows plus rapides et plus fluides
Moins d’erreurs sur le terrain, même en environnement bruyant ou multilingue
🚀 Une précision accrue pour déployer davantage de cas d’usage
💎

Innovation incluse

La technologie VEC est intégrée au Logistics Performance Pack. Elle traite les séquences alphanumériques de 1 à 7 caractères avec une latence ultra-faible (< 10 ms), directement dans la pipeline ASR, sans dépendance supplémentaire.

⚡ Prêt pour le déploiement
🏅

Un standard du secteur

Cette technologie répond aux exigences de précision vocale et d’ergonomie des opérations logistiques dans le retail et l’e-commerce, conformément aux critères mis en avant dans l'étude Gartner 2025 WMS Critical Capabilities.

Nouveautés VDK 6.2

Voice Recognition User Words

Alignez la reconnaissance vocale sur la réalité de vos opérations. La VDK 6.2 permet d'indexer des échantillons audio réels sur des termes cibles, adaptant ainsi l'IA aux spécificités d'élocution et au lexique métier de vos utilisateurs.

Challenge

Les modèles génériques passent à côté de l'essentiel :

🗣️ Noms, acronymes et termes métiers sont fréquemment mal reconnus.
🌍La prononciation varie selon l'utilisateur, la région ou l'équipe.
⏱️L'ajustement manuel et les boucles de correction ralentissent le déploiement.
La valeur ajoutée

Une reconnaissance optimisée là où l'ASR standard échoue :

Réduisez les frictions lors des interactions vocales critiques.
Améliorez la fiabilité en production dès le premier jour.
🎯Précision accrue sur le vocabulaire custom sans complexité d'ingénierie.
🎙️ Reconnaissance Personnalisée
Fonctionnalité Runtime 6.2

Apprenez au système le langage réel de vos utilisateurs.

La fonctionnalité User Words permet d'associer une capture audio utilisateur à un mot ou une expression spécifique. Vous obtenez une précision chirurgicale sur les noms propres, le jargon technique ou les acronymes, sans aucune modification de la logique applicative existante.

1

Capture

Enregistrez un échantillon audio directement auprès du locuteur en contexte réel.

2

Association

Liez cet échantillon à un terme cible (nom, code, acronyme ou terme métier).

3

Recognize

Améliorez la précision en conditions réelles sans réentraînement de modèle ni recompilation de l'application.

Cas d'usage types

Noms d'employés
Références produits
Acronymes
Vocabulaire d'entrepôt
Langage propre à la marque
Termes médicaux

Bénéfices opérationnels

Une précision accrue sur votre vocabulaire spécifique.

Améliorez la qualité de reconnaissance des mots les plus critiques pour vos utilisateurs, vos workflows et votre environnement métier.

Bénéfices

Rapide à déployer, facile à scaler.

🔌Aucune modification requise du code applicatif existant.
🧩S'intègre naturellement à vos flux vocaux actuels.
📈Évolutif par utilisateur, équipe et contexte opérationnel.
Cas d’usage

Optimisé pour le lexique opérationnel de terrain.

📦Références et identifiants d'articles.
🏭Jargon technique et vocabulaire spécifique aux sites.
🏥Termes médicaux et noms de praticiens.
Couverture vocale mondiale

Plus de 65 langues

43
Pour les commandes vocales et les mots déclencheurs (ASR)
43
Pour la saisie vocale en texte (STT)
65
Pour la synthèse vocale (TTS)
20
Pour la synthèse vocale naturelle (TTS)
🇺🇸
Anglais
États-Unis
ASR STT TTS TTS naturel
🇬🇧
Anglais
Royaume-Uni
ASR STT TTS TTS naturel
🇫🇷
Français
France
ASR STT TTS TTS naturel
🇩🇪
Allemand
Allemagne
ASR STT TTS TTS naturel
🇪🇸
Espagnol
Espagne
ASR STT TTS TTS naturel
🇲🇽
Espagnol
Mexique
ASR STT TTS TTS naturel
🇮🇹
Italien
Italie
ASR STT TTS TTS naturel
🇧🇷
Portugais
Brésil
ASR STT TTS TTS naturel
🇵🇹
Portugais
Portugal
ASR STT TTS TTS naturel
🇳🇱
Néerlandais
Pays-Bas
ASR STT TTS TTS naturel
🇵🇱
Polonais
Pologne
ASR STT TTS TTS naturel
🇷🇺
Russe
Russie
ASR STT TTS TTS naturel
🇨🇳
Mandarin
Chine
ASR STT TTS TTS naturel
🇸🇪
Suédois
Suède
ASR STT TTS TTS naturel
🇳🇴
Norvégien
Norvège
ASR STT TTS TTS naturel
🇩🇰
Danois
Danemark
ASR STT TTS TTS naturel
🇨🇿
Tchèque
Tchéquie
ASR STT TTS TTS naturel
🇮🇳
Anglais
Inde
ASR STT TTS TTS naturel
🇬🇷
Grec
Grèce
ASR STT TTS TTS naturel
🇮🇳
Hindi
Inde
ASR STT TTS TTS naturel
🇦🇺
Anglais
Australie
ASR STT TTS
🇧🇬
Bulgare
Bulgarie
ASR STT TTS
🇭🇰
Cantonais
Hong Kong
ASR STT TTS
🇨🇳
Chinois
Sichuan
ASR STT TTS
🇫🇮
Finnois
Finlande
ASR STT TTS
🇨🇦
Français
Canada
ASR STT TTS
🇮🇱
Hébreu
Israël
ASR STT TTS
🇭🇺
Hongrois
Hongrie
ASR STT TTS
🇮🇩
Indonésien
Indonésie
ASR STT TTS
🇯🇵
Japonais
Japon
ASR STT TTS
🇰🇷
Coréen
Corée du Sud
ASR STT TTS
🇹🇼
Mandarin
Taïwan
ASR STT TTS
🇸🇰
Slovaque
Slovaquie
ASR STT TTS
🇮🇳
Tamoul
Tamil Nadu
ASR STT TTS
🇮🇳
Télougou
Inde
ASR STT TTS
🇹🇭
Thaï
Thaïlande
ASR STT TTS
🇹🇷
Turc
Turquie
ASR STT TTS
🇸🇦
Arabe
Arabie saoudite
ASR STT
🇨🇳
Cantonais
Chine
ASR STT
🇨🇳
Anglais
Chine
ASR STT
🇯🇵
Anglais
Japon
ASR STT
🇰🇷
Anglais
Corée du Sud
ASR STT
🇲🇾
Anglais
Malaisie
ASR STT
🌏
Arabe
Golfe persique
TTS
🌍
Arabe
Monde
TTS
🇪🇸
Basque
Espagne
TTS
🇮🇳
Bengali
Inde
TTS
🇮🇳
Bhojpuri
Jharkhand
TTS
🇪🇸
Catalan
Espagne
TTS
🇨🇳
Mandarin
Nord-Est de la Chine
TTS
🇨🇳
Chinois
Shanghai
TTS
🇨🇳
Chinois
Shaanxi
TTS
🇭🇷
Croate
Croatie
TTS
🇧🇪
Néerlandais
Belgique
TTS
🏴
Anglais
Écosse
TTS
🇮🇪
Anglais
Irlande
TTS
🇿🇦
Anglais
Afrique du Sud
TTS
🌏
Farsi
Golfe persique
TTS
🇧🇪
Français
Belgique
TTS
🇪🇸
Galicien
Galice
TTS
🇮🇳
Kannada
Karnataka
TTS
🇲🇾
Malais
Malaisie
TTS
🇮🇳
Marathi
Inde
TTS
🇷🇴
Roumain
Roumanie
TTS
🇸🇮
Slovène
Slovénie
TTS
🇦🇷
Espagnol
Argentine
TTS
🇨🇱
Espagnol
Chili
TTS
🇨🇴
Espagnol
Colombie
TTS
🇺🇦
Ukrainien
Ukraine
TTS
🇪🇸
Valencien
Valence
TTS
🇻🇳
Vietnamien
Vietnam
TTS
Synthèse vocale naturelle de pointe
20 langues avec une qualité de voix naturelle
Les composants de la plateforme Voice AI

Une suite complète pour les projets Voice AI évolutifs

De la conception au déploiement, une plateforme pensée pour créer et faire évoluer vos solutions vocales.

Plateforme de gestion

VDK Console

Centralisez l’accès aux projets, la gestion des rôles et des technologies au sein d’un espace collaboratif unique. Travaillez où que vous soyez, sur n’importe quel appareil, sans installation locale ni mise à jour manuelle.

  • Une vue centralisée sur les projets, les équipes et les accès
  • Prise en charge des environnements multi-projets et multi-utilisateurs
  • Accès en temps réel aux derniers outils et tableaux de bord
Plateforme de développement

De la création au déploiement

VDK Studio

Un environnement de développement web en ligne, constamment mis à jour. Concevez, configurez et testez des applications vocales hors ligne, avec génération de commandes assistée par IA et validation en temps réel.

  • Accès depuis le navigateur
  • Générateur de commandes par IA
  • Traduction en un clic
  • Tests unitaires en lot

VDK Developer Toolbox

Un ensemble d’exemples, de modèles et d’outils préconfigurés pour simplifier l’intégration. Inclut la gestion des packages, des exemples de code et une documentation détaillée.

  • Modèles de code
  • Gestion des packages
  • Documentation guidée

VDK API

Une solution cloud pour gérer dynamiquement les commandes vocales sur l’ensemble de vos déploiements. Créez et mettez à jour vos commandes instantanément, sans manipulation manuelle de fichiers.

  • Gestion dynamique des commandes
  • Sans manipulation manuelle de fichiers
  • Solution cloud
Runtime Platform

Conçue pour une exécution en temps réel

Remplacez les limitations des architectures traditionnelles requête/réponse par une architecture de streaming continu. VDK Service est conçu pour gérer des flux vocaux à haut débit sans latence.

VDK Service

Moteur de traitement audio en temps réel pour créer des workflows vocaux de bout en bout. Concevez des pipelines modulaires où l’audio circule de l’entrée au traitement puis à la sortie à travers une séquence structurée de Producteurs, Modificateurs et Consommateurs.

Chaque pipeline s’exécute dans une session qui gère l’exécution et la communication, vous permettant de diffuser l’audio en continu et de recevoir les résultats instantanément. Remplacez plusieurs services vocaux par un système unique et cohérent, déployable sur Windows, Linux et Android sous forme de runtime embarqué, avec des performances fiables hors ligne, même dans des environnements à faible connectivité.

Architecture
  • Architecture modulaire en pipeline avec Producteurs, Modificateurs et Consommateurs
  • Les Modificateurs transforment l’audio en temps réel, notamment avec l’amélioration audio et l’extraction de canaux
  • Les Consommateurs génèrent des résultats tels que la transcription, la sortie audio, le stockage de données et la biométrie vocale.
  • Prise en charge des sorties parallèles afin de traiter l’audio une seule fois et le réutiliser de plusieurs façons
Exécution
  • Streaming en temps réel via WebSocket pour une entrée et une sortie continues
  • Exécution basée sur des sessions : configurer d’abord, lancer ensuite à la demande
  • API REST pour la gestion du cycle de vie et de la configuration
Déploiement
  • Support multi-plateforme sur Windows, Linux et Android
  • Runtime embarquable pour un déploiement on-device
  • Performances fiables hors ligne dans des environnements à faible connectivité
MOTEUR VDK SERVICE FLUX PIPELINE EN TEMPS RÉEL
SESSION ACTIVE Streaming en cours
PRODUCTEUR
Entrée audio
Micro / Fichier / Flux
Envoi des données via socket
MODIFICATEURS
Traitement
Réduction du bruit / Extraction de canaux
CONSOMMATEURS
Transcription (ASR)
Biométrie vocale
Persistance de fichiers
Lecteur faible latence
Réception des données via socket

Conçue pour une exécution en temps réel

Pensez en sessions pour l’exécution et en pipelines pour les flux
Diffusez l’audio en continu au lieu de vous appuyer sur un modèle requête/réponse
Construisez une fois et évoluez d’un flux simple vers des systèmes plus complexes

Prêt à créer ?

Commencez avec un pipeline simple et faites-le évoluer selon vos besoins.

Demander une démo

Bénéfices métier

Des résultats concrets sur le terrain

Retour sur investissement rapide

Un déploiement plus rapide, une productivité accrue et des opérations plus fiables, pour un ROI mesurable en 6 à 9 mois.

Sécurité renforcée

Garantit que seules les personnes autorisées accèdent aux systèmes et aux workflows critiques.

Opérations simplifiées

Assure des performances stables sur une grande diversité de matériels

Intégration simplifiée

Pour une mise en place plus rapide et un temps de formation réduit.

Une meilleure expérience utilisateur

Grâce à une communication plus claire, plus fluide et plus réactive.

Prise en compte de la diversité des équipes

Adapté aux différents accents, dialectes et langues

Prêt à transformer vos solutions ?

Échangez avec notre équipe pour faire évoluer vos solutions dès aujourd’hui

Commencer
×
VDK 6.2.0 • Avril 2026

Les nouveautés de la version 6.2

La VDK 6.2 redéfinit les standards de l'industrie avec des fonctionnalités critiques visant l'excellence opérationnelle : précision accrue, flexibilité architecturale, et une exécution temps réel sans compromis.

Optimisez vos interfaces vocales avec une solution plus rapide, plus fiable et parfaitement scalable, quel que soit l'écosystème de déploiement.

Optimisez vos interfaces vocales avec une solution plus rapide, plus fiable et parfaitement scalable, quel que soit l'écosystème de déploiement.

  • Amélioration de la précision via la personnalisation des entrées vocales.
  • Gestion de session optimisée grâce à un contrôle structuré du cycle de vie.
  • Latence réduite par l'intégration du traitement audio en flux continu.
🎙️

Reconnaissance Vocale : User Words

Optimisez la reconnaissance des termes complexes — noms propres, acronymes, jargon technique ou lexique spécifique — en associant des échantillons audio utilisateurs à des entrées textuelles ciblées. Garantissez une reproduction fidèle et une précision constante, adaptée aux particularités d'élocution de chaque utilisateur.

VDK Service

Traitez les flux audio en temps réel grâce à une architecture modulaire composée de Producers, Modifiers et Consumers. Ce pipeline permet des temps de réponse ultra-courts et une fluidité accrue, facilitant le passage à l'échelle de vos services vocaux sur tous types de terminaux.

Session Routes Pilotez la création et l'administration des sessions via des points de terminaison (endpoints) dédiés. Ce contrôle total sur le cycle de vie des échanges simplifie l'intégration logicielle et réduit significativement la complexité des phases de développement.

Avec le VDK 6.2, les développeurs disposent d'une infrastructure robuste pour concevoir les applications vocales de nouvelle génération.