✨ VDK 6.3 est désormais disponible, intégrant la dernière génération de technologie de reconnaissance vocale neuronale embarquée de Cerence.

Plateforme Open Voice AI

L’IA vocale embarquée,
pour les applications métier

La suite complète pour développer des projets d’IA vocale évolutifs, grâce à une plateforme de développement qui réunit Console, Studio, Developer Toolbox et Runtime.
Créez des solutions vocales sur mesure et des workflows pilotés par la voix, fonctionnant hors ligne sur tout type de matériel, avec un contrôle total sur vos données et votre déploiement.

Essayer le VDK 6 Voir le VDK 6 en action

Technologies vocales

65+

Langues

100 % hors ligne et embarqué

Fonctionne sans connexion Internet

Compatible avec tout type de matériel

Déployez sur n’importe quel appareil ou plateforme

Entièrement personnalisable

Adaptez la solution à vos workflows

Technologies vocales

Incluses par défaut dans le VDK 6

6 technologies d’IA vocale

Créez des expériences vocales avancées avec notre suite complète.

Commandes vocales

Contrôle vocal intelligent

Pilotez vos applications métier à la voix et exécutez vos tâches plus rapidement. Les opérateurs terrain et les soignants réduisent les interactions physiques tout en gagnant en productivité.

✓

Prise en charge multilingue

✓

Traitement hors ligne

✓

Réponses contextualisées

En savoir plus sur les commandes vocales

Détection du mot déclencheur

Toujours à l’écoute, toujours prêt

Activez l’interface vocale grâce à des mots déclencheurs personnalisés. Toujours active et à faible consommation d’énergie, la détection assure une réponse immédiate. Les anti-mots déclencheurs réduisent les activations accidentelles pour garantir un déclenchement uniquement lorsqu’il est réellement souhaité.

✓

Entraînement de mots déclencheurs personnalisés

✓

Faible consommation d’énergie

✓

Détection haute précision

✓

Filtrage des anti-mots déclencheurs

En savoir plus sur le mot déclencheur

Synthèse vocale (TTS)

Une voix naturelle et fluide

Diffusez des consignes vocales claires et adaptées aux opérateurs terrain comme aux soignants. Ajustez la vitesse de lecture pour gagner en efficacité, augmentez le volume pour plus de clarté et adaptez la restitution à chaque environnement d’utilisation.

✓

Plus de 65 voix disponibles

✓

18 langues TTS neuronales

✓

Compatible SSML

En savoir plus sur la synthèse vocale

Biométrie vocale

Authentification vocale sécurisée

Identifiez et authentifiez les utilisateurs à partir de leur empreinte vocale. Garantissez un accès fluide et sécurisé, sans mot de passe ni code PIN.

✓

Authentification de l’utilisateur

✓

Identification de l’utilisateur

✓

Protection contre l’imitation de la voix

✓

Configuration rapide

En savoir plus sur la biométrie vocale

Amélioration audio

Un traitement audio précis et efficace

Grâce à un traitement avancé du signal, le bruit, l’écho et la réverbération sont réduits pour garantir une qualité audio optimale dans tous les environnements et une reconnaissance plus fiable.

✓

Réduction du bruit

✓

Annulation d’écho

✓

Beamforming

✓

Contrôle du gain

En savoir plus sur l’amélioration audio

Bientôt disponible

La démo de la technologie de saisie vocale sera bientôt disponible.

Saisie vocale

Une saisie vocale continue et fiable

La parole est convertie en texte en temps réel avec une grande précision. Idéale pour la documentation, le reporting, la prise de notes et les usages de dictée longue.

✓

Saisie vocale continue

✓

Grande précision

✓

Vocabulaire personnalisé

✓

Transcription en temps réel

Bientôt disponible

Voice Error Correction

Une reconnaissance vocale précise en conditions réelles

Vivoka rend la reconnaissance vocale plus précise et plus fiable en conditions réelles, même là où les ASR traditionnels échouent.

L’ASR seul atteint vite ses limites

🔇 Le bruit réduit la précision

🗣️ Les accents augmentent le risque d’erreur

⚡ Un débit de parole élevé complique la reconnaissance

⚠️ En contexte métier, la reconnaissance devient moins fiable

Vivoka améliore la précision

🎯 Réduction du bruit grâce à un traitement audio avancé

🌍 Une reconnaissance plus robuste face aux accents

💬 Une reconnaissance plus stable, même lorsque la parole est rapide ou moins nette

📊 Les listes de contexte guident la reconnaissance vers les bonnes séquences

⚙️ Des listes de contexte volumineuses, sans compromis sur les performances

L’impact

77 %

d’erreurs en moins*

*Étude interne sur des cas d’usage alphanumériques en conditions réelles

⚡ Des workflows plus rapides et plus fluides

✅ Moins d’erreurs sur le terrain, même en environnement bruyant ou multilingue

🚀 Une précision accrue pour déployer davantage de cas d’usage

💎

Innovation incluse

La technologie VEC est intégrée au Logistics Performance Pack. Elle traite les séquences alphanumériques de 1 à 7 caractères avec une latence ultra-faible (< 10 ms), directement dans la pipeline ASR, sans dépendance supplémentaire.

⚡ Prêt pour le déploiement

🏅

Un standard du secteur

Cette technologie répond aux exigences de précision vocale et d’ergonomie des opérations logistiques dans le retail et l’e-commerce, conformément aux critères mis en avant dans l'étude Gartner 2025 WMS Critical Capabilities.

Nouveautés VDK 6.2

Voice Recognition User Words

Alignez la reconnaissance vocale sur la réalité de vos opérations. La VDK 6.2 permet d'indexer des échantillons audio réels sur des termes cibles, adaptant ainsi l'IA aux spécificités d'élocution et au lexique métier de vos utilisateurs.

Challenge

Les modèles génériques passent à côté de l'essentiel :

🗣️ Noms, acronymes et termes métiers sont fréquemment mal reconnus.

🌍La prononciation varie selon l'utilisateur, la région ou l'équipe.

⏱️L'ajustement manuel et les boucles de correction ralentissent le déploiement.

La valeur ajoutée

Une reconnaissance optimisée là où l'ASR standard échoue :

✅Réduisez les frictions lors des interactions vocales critiques.

⚡Améliorez la fiabilité en production dès le premier jour.

🎯Précision accrue sur le vocabulaire custom sans complexité d'ingénierie.

🎙️ Reconnaissance Personnalisée

Fonctionnalité Runtime 6.2

Apprenez au système le langage réel de vos utilisateurs.

La fonctionnalité User Words permet d'associer une capture audio utilisateur à un mot ou une expression spécifique. Vous obtenez une précision chirurgicale sur les noms propres, le jargon technique ou les acronymes, sans aucune modification de la logique applicative existante.

Capture

Enregistrez un échantillon audio directement auprès du locuteur en contexte réel.

Association

Liez cet échantillon à un terme cible (nom, code, acronyme ou terme métier).

Recognize

Améliorez la précision en conditions réelles sans réentraînement de modèle ni recompilation de l'application.

Cas d'usage types

Noms d'employés

Références produits

Acronymes

Vocabulaire d'entrepôt

Langage propre à la marque

Termes médicaux

Bénéfices opérationnels

Une précision accrue sur votre vocabulaire spécifique.

Améliorez la qualité de reconnaissance des mots les plus critiques pour vos utilisateurs, vos workflows et votre environnement métier.

Bénéfices

Rapide à déployer, facile à scaler.

🔌Aucune modification requise du code applicatif existant.

🧩S'intègre naturellement à vos flux vocaux actuels.

📈Évolutif par utilisateur, équipe et contexte opérationnel.

Cas d’usage

Optimisé pour le lexique opérationnel de terrain.

📦Références et identifiants d'articles.

🏭Jargon technique et vocabulaire spécifique aux sites.

🏥Termes médicaux et noms de praticiens.

Tester le VDK 6.2 →

Couverture vocale mondiale

Plus de 65 langues

✨ Mise à jour VDK 6.3 · 23 langues passent à la STT neuronale

La dernière génération de technologie de reconnaissance vocale neuronale embarquée de Cerence est désormais intégrée au VDK. Elle améliore la reconnaissance vocale dans les environnements multilingues, avec accents et bruits réels, avec une optimisation supplémentaire grâce au Speech Enhancement, au VEC et aux User Words de Vivoka.

Pour les commandes vocales et les mots de réveil (ASR)

Pour la saisie vocale de texte (STT)

Pour la synthèse vocale (TTS)

Pour la synthèse vocale naturelle (TTS)

🔍

🇺🇸

Anglais

États-Unis

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇬🇧

Anglais

Royaume-Uni

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇫🇷

Français

France

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇩🇪

Allemand

Allemagne

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇪🇸

Espagnol

Espagne

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇲🇽

Espagnol

Mexique

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇮🇹

Italien

Italie

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇧🇷

Portugais

Brésil

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇵🇹

Portugais

Portugal

ASR STT TTS TTS naturelle

🇳🇱

Néerlandais

Pays-Bas

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇵🇱

Polonais

Pologne

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇷🇺

Russe

Russie

ASR STT TTS TTS naturelle

🇨🇳

Mandarin

Chine

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇸🇪

Suédois

Suède

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇳🇴

Norvégien

Norvège

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇩🇰

Danois

Danemark

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇨🇿

Tchèque

Tchéquie

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇮🇳

Anglais

Inde

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇬🇷

Grec

Grèce

ASR STT TTS TTS naturelle

🇮🇳

Hindi

Inde

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS TTS naturelle

🇦🇺

Anglais

Australie

ASR STT TTS

🇧🇬

Bulgare

Bulgarie

ASR STT TTS

🇭🇰

Cantonais

Hong Kong

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS

🇨🇳

Chinois

Sichuan

ASR STT TTS

🇫🇮

Finnois

Finlande

ASR STT TTS

🇨🇦

Français

Canada

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS

🇮🇱

Hébreu

Israël

ASR STT TTS

🇭🇺

Hongrois

Hongrie

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS

🇮🇩

Indonésien

Indonésie

ASR STT TTS

🇯🇵

Japonais

Japon

ASR STT Nouveau dans le VDK 6.3 · STT neuronale TTS

🇰🇷

Coréen

Corée du Sud

ASR STT TTS

🇹🇼

Mandarin

Taïwan

ASR STT TTS

🇸🇰

Slovaque

Slovaquie

ASR STT TTS

🇮🇳

Tamoul

Tamil Nadu

ASR STT TTS

🇮🇳

Télougou

Inde

ASR STT TTS

🇹🇭

Thaï

Thaïlande

ASR STT TTS

🇹🇷

Turc

Turquie

ASR STT TTS

🇸🇦

Arabe

Arabie saoudite

ASR STT Nouveau dans le VDK 6.3 · STT neuronale

🇨🇳

Cantonais

Chine

ASR STT Nouveau dans le VDK 6.3 · STT neuronale

🇨🇳

Anglais

Chine

ASR STT

🇯🇵

Anglais

Japon

ASR STT

🇰🇷

Anglais

Corée du Sud

ASR STT

🇲🇾

Anglais

Malaisie

ASR STT

🌏

Arabe

Golfe Persique

TTS

🌍

Arabe

Monde

TTS

🇪🇸

Basque

Espagne

TTS

🇮🇳

Bengali

Inde

TTS

🇮🇳

Bhojpuri

Jharkhand

TTS

🇪🇸

Catalan

Espagne

TTS

🇨🇳

Mandarin

Nord-Est de la Chine

TTS

🇨🇳

Chinois

Shanghai

TTS

🇨🇳

Chinois

Shaanxi

TTS

🇭🇷

Croate

Croatie

TTS

🇧🇪

Néerlandais

Belgique

TTS

🏴󠁧󠁢󠁳󠁣󠁴󠁿

Anglais

Écosse

TTS

🇮🇪

Anglais

Irlande

TTS

🇿🇦

Anglais

Afrique du Sud

TTS

🌏

Persan

Golfe Persique

TTS

🇧🇪

Français

Belgique

TTS

🇪🇸

Galicien

Galice

TTS

🇮🇳

Kannada

Karnataka

TTS

🇲🇾

Malais

Malaisie

TTS

🇮🇳

Marathi

Inde

TTS

🇷🇴

Roumain

Roumanie

TTS

🇸🇮

Slovène

Slovénie

TTS

🇦🇷

Espagnol

Argentine

TTS

🇨🇱

Espagnol

Chili

TTS

🇨🇴

Espagnol

Colombie

TTS

🇺🇦

Ukrainien

Ukraine

TTS

🇪🇸

Valencien

Valence

TTS

🇻🇳

Vietnamien

Vietnam

TTS

✨

TTS naturelle et STT neuronale de pointe

20 langues avec une qualité vocale naturelle, ainsi que 23 langues avec STT neuronale de qualité naturelle introduites dans le VDK 6.3.

Les composants de la plateforme Voice AI

Une suite complète pour les projets Voice AI évolutifs

De la conception au déploiement, une plateforme pensée pour créer et faire évoluer vos solutions vocales.

Plateforme de gestion

VDK Console

Centralisez l’accès aux projets, la gestion des rôles et des technologies au sein d’un espace collaboratif unique. Travaillez où que vous soyez, sur n’importe quel appareil, sans installation locale ni mise à jour manuelle.

Une vue centralisée sur les projets, les équipes et les accès
Prise en charge des environnements multi-projets et multi-utilisateurs
Accès en temps réel aux derniers outils et tableaux de bord

Plateforme de développement

De la création au déploiement

VDK Studio

Un environnement de développement web en ligne, constamment mis à jour. Concevez, configurez et testez des applications vocales hors ligne, avec génération de commandes assistée par IA et validation en temps réel.

Accès depuis le navigateur
Générateur de commandes par IA
Traduction en un clic
Tests unitaires en lot

VDK Developer Toolbox

Un ensemble d’exemples, de modèles et d’outils préconfigurés pour simplifier l’intégration. Inclut la gestion des packages, des exemples de code et une documentation détaillée.

Modèles de code
Gestion des packages
Documentation guidée

VDK API

Une solution cloud pour gérer dynamiquement les commandes vocales sur l’ensemble de vos déploiements. Créez et mettez à jour vos commandes instantanément, sans manipulation manuelle de fichiers.

Gestion dynamique des commandes
Sans manipulation manuelle de fichiers
Solution cloud

Runtime Platform

Conçue pour une exécution en temps réel

Remplacez les limitations des architectures traditionnelles requête/réponse par une architecture de streaming continu. VDK Service est conçu pour gérer des flux vocaux à haut débit sans latence.

VDK Service

Moteur de traitement audio en temps réel pour créer des workflows vocaux de bout en bout. Concevez des pipelines modulaires où l’audio circule de l’entrée au traitement puis à la sortie à travers une séquence structurée de Producteurs, Modificateurs et Consommateurs.

Chaque pipeline s’exécute dans une session qui gère l’exécution et la communication, vous permettant de diffuser l’audio en continu et de recevoir les résultats instantanément. Remplacez plusieurs services vocaux par un système unique et cohérent, déployable sur Windows, Linux et Android sous forme de runtime embarqué, avec des performances fiables hors ligne, même dans des environnements à faible connectivité.

Architecture

Architecture modulaire en pipeline avec Producteurs, Modificateurs et Consommateurs
Les Modificateurs transforment l’audio en temps réel, notamment avec l’amélioration audio et l’extraction de canaux
Les Consommateurs génèrent des résultats tels que la transcription, la sortie audio, le stockage de données et la biométrie vocale.
Prise en charge des sorties parallèles afin de traiter l’audio une seule fois et le réutiliser de plusieurs façons

Exécution

Streaming en temps réel via WebSocket pour une entrée et une sortie continues
Exécution basée sur des sessions : configurer d’abord, lancer ensuite à la demande
API REST pour la gestion du cycle de vie et de la configuration

Déploiement

Support multi-plateforme sur Windows, Linux et Android
Runtime embarquable pour un déploiement on-device
Performances fiables hors ligne dans des environnements à faible connectivité

MOTEUR VDK SERVICE FLUX PIPELINE EN TEMPS RÉEL

SESSION ACTIVE Streaming en cours

PRODUCTEUR

Entrée audio

Micro / Fichier / Flux
Envoi des données via socket

MODIFICATEURS

Traitement

Réduction du bruit / Extraction de canaux

CONSOMMATEURS

Transcription (ASR)

Biométrie vocale

Persistance de fichiers

Lecteur faible latence

Réception des données via socket

Conçue pour une exécution en temps réel

Pensez en sessions pour l’exécution et en pipelines pour les flux

Diffusez l’audio en continu au lieu de vous appuyer sur un modèle requête/réponse

Construisez une fois et évoluez d’un flux simple vers des systèmes plus complexes

Prêt à créer ?

Commencez avec un pipeline simple et faites-le évoluer selon vos besoins.

Demander une démo

Bénéfices métier

Des résultats concrets sur le terrain

Retour sur investissement rapide

Un déploiement plus rapide, une productivité accrue et des opérations plus fiables, pour un ROI mesurable en 6 à 9 mois.

Sécurité renforcée

Garantit que seules les personnes autorisées accèdent aux systèmes et aux workflows critiques.

Opérations simplifiées

Assure des performances stables sur une grande diversité de matériels

Intégration simplifiée

Pour une mise en place plus rapide et un temps de formation réduit.

Une meilleure expérience utilisateur

Grâce à une communication plus claire, plus fluide et plus réactive.

Prise en compte de la diversité des équipes

Adapté aux différents accents, dialectes et langues

Prêt à transformer vos solutions ?

Échangez avec notre équipe pour faire évoluer vos solutions dès aujourd’hui

Commencer

Le VDK 6.3 • Juin 2026

Le VDK 6.3 introduit la transcription vocale neuronale

Transformez la voix en texte directement dans vos applications embarquées, avec une précision accrue dans les environnements professionnels exigeants, sans perturber les flux de travail existants.

Amélioration de la précision de la transcription vocale neuronale Jusqu’à +56 %

Selon le cas d’usage, l’environnement acoustique, le contexte linguistique, les accents et le vocabulaire propre à chaque secteur.

Ce qui change

Une transcription vocale plus fiable

La transcription vocale neuronale améliore la précision, la prise en charge des accents, les performances multilingues et la robustesse dans des conditions terrain bruyantes ou variables.

Ce que cela permet

L’IA vocale au-delà des simples commandes

Les équipes peuvent désormais dicter, transcrire et traiter des informations vocales directement dans leurs applications, ouvrant la voie à des cas d’usage plus larges tout en conservant une architecture entièrement embarquée et hors ligne.

Nouvelles applications rendues possibles

📝

Notes et commentaires dictés

Saisissez des informations plus longues à la voix, directement dans les applications métier.

⚠️

Signalement d’exceptions

Signalez les problèmes, anomalies et exceptions en mode mains libres sur le terrain.

🤖

Assistants IA et copilotes

Utilisez la voix comme interface d’entrée pour vos assistants embarqués.

📋

Documentation mains libres

Documentez les actions, observations et rapports sans interrompre le travail.

🛠️

Interventions terrain

Facilitez les inspections, les notes de maintenance et les tâches de service sur site.

🧩

Aucune refonte des flux de travail

Conservez vos intégrations, vos flux de travail et vos commandes vocales existantes.

Transcription vocale neuronale entièrement embarquée et hors ligne pour la logistique, les interventions terrain, la santé et les environnements d’entreprise.

Essayez maintenant → En savoir plus

L’IA vocale embarquée, pour les applications métier

6 technologies d’IA vocale

Commandes vocales

Détection du mot déclencheur

Synthèse vocale (TTS)

Biométrie vocale

Amélioration audio

Bientôt disponible

Saisie vocale

Une reconnaissance vocale précise en conditions réelles

L’ASR seul atteint vite ses limites

Vivoka améliore la précision

L’impact

Innovation incluse

Un standard du secteur

Voice Recognition User Words

Les modèles génériques passent à côté de l'essentiel :

Une reconnaissance optimisée là où l'ASR standard échoue :

Apprenez au système le langage réel de vos utilisateurs.

Capture

Association

Recognize

Cas d'usage types

Bénéfices opérationnels

Rapide à déployer, facile à scaler.

Optimisé pour le lexique opérationnel de terrain.

Plus de 65 langues

Une suite complète pour les projets Voice AI évolutifs

VDK Console

De la création au déploiement

VDK Studio

VDK Developer Toolbox

VDK API

Conçue pour une exécution en temps réel

VDK Service

Conçue pour une exécution en temps réel

Prêt à créer ?

Bénéfices métier

Retour sur investissement rapide

Sécurité renforcée

Opérations simplifiées

Intégration simplifiée

Une meilleure expérience utilisateur

Prise en compte de la diversité des équipes

Prêt à transformer vos solutions ?

Le VDK 6.3 introduit la transcription vocale neuronale

Une transcription vocale plus fiable

L’IA vocale au-delà des simples commandes

Notes et commentaires dictés

Signalement d’exceptions

Assistants IA et copilotes

Documentation mains libres

Interventions terrain

Aucune refonte des flux de travail

L’IA vocale embarquée,
pour les applications métier