Front-End Audio, amélioration du signal audio
Améliorez le signal audio grâce à une solution clé en main de Front-End Audio qui évalue la qualité du signal et applique un filtre accoustique spécifique (réduction de bruit et suppression d’écho).
Pour se familiariser avec la technologie AFE
Qu’est-ce que le Front-End Audio ?
Le Front-End Audio (AFE) est une technologie de traitement du signal audio. Il est souvent utilisé pour faciliter les interactions Homme-Machine intégrant des microphones dans l’utilisation des appareils.
L’AFE permet une reconnaissance des commandes vocales plus précise dans n’importe quel environnement en retirant les sons interférants capturés par le microphone.
Il extrait la voix de l’utilisateur et supprime les sons indésirables pour fournir une reconnaissance claire et permettre la compréhension de l’utilisateur.
Fonctionnalités
Comment utiliser l’amélioration Audio ?
Évaluez la qualité du signal audio et décidez des mesures correctives
Téléchargez ou enregistrez directement tout type de fichier audio pour évaluer sa qualité. Afin de tirer le meilleur parti de l’AFE, il est important de mesurer la qualité de fichiers audio enregistrés dans les conditions dans lesquelles sera utilisées la solution vocale.
L’évaluation du signal audio est basé sur des algorithmes d’apprentissage automatique qui donnent un score global sur le ratio bruit-signal, sur l’écho et la fiabilité de l’audio.
Appliquez des filtres correctifs pour améliorer la qualité et la précision de la reconnaissance
Lorsque la qualité du signal audio est médiocre, plusieurs solutions sont possibles. La plupart seraient difficiles à mettre en oeuvre, comme le fait de changer tous les microphones utilisés. Le plus simple est d’appliquer des filtres audio pour nettoyer le plus possible le signal.
Les filtres viseront les mêmes étapes d’évaluation, SNR (rapport signal/bruit), RT60 (niveau d’écho) et MOS (fiabilité du signal).
Bénéfices
Pourquoi utiliser notre solution
d’Amélioration Audio ?
Hors connexion
Pas besoin d’une connexion à Internet pour améliorer la qualité audio à tout moment.
Traitement en temps réel
Pas de latence pour un processus d’amélioration de l’audio en continu.
Protection des données
Les données utilisateurs ne sont pas transférées et restent à l’abri des failles de sécurité.
Maîtrise des coûts
Pas de frais cachés. Nous travaillons avec le modèle tarifaire qui vous convient le mieux.
Complémentarité
L’AFE est le complément parfait pour tout produit ou service vocal.
Multiplateforme
Simple à développer et à intégrer sur toutes les plateformes (windows, linux, android…).
Pour les développeurs, par des développeurs
Commencez à développer votre solution d'IA vocale avec le VDK
1
Inscrivez-vous sur la Console
Avant d'intégrer la voix avec le VDK, testez notre Console en ligne.
2
Développez et testez
Définissez et créez votre projet pour développer vos fonctionnalités.
3
Partagez votre projet
Partagez votre projet et discutez-en avec nos experts pour une intégration.
Les entreprises qui ont choisi notre solution
Les retours de nos clients concernant nos technologies
“Nous avons intégré les technologies de Vivoka dans nos solutions dédiées à l'ergonomie des équipements dans l'industrie, garantissant performance et confidentialité des données.”
Guillaume Jégou
Responsable laboratoire Human Factors Technology
"Les solutions de Vivoka peuvent fonctionner hors ligne, sur appareil, pour opérer n’importe où, n’importe quand et avec un large support linguistique, ce qui est pour nos produits un avantage concurrentiel conséquent."
Paul Travers
Directeur général
"Nous nous sommes associés à Vivoka sur plusieurs projets innovants sur des systèmes Linux embarqués, et avons livré, dans un délai très court, des interactions vocales naturelles multilingues fonctionnant entièrement hors-ligne à nos clients."
Cédric Vincent
VP de la technologie logicielle
Informations techniques
Comment développer avec notre système d’amélioration Audio ?
Notre système de Front-End Audio est basé sur 3 indicateurs pour l’évaluation et pour les fitres.
- Le Rapport Signal-Bruit (S/B ou SNR en anglais) : mesure le pouvoir du signal par rapport au pouvoir du bruit ambiant. Il exprime la valeur en dB ou en échelle.
- Le Temps de Réverbération Acoustique (RT60) : mesure le temps nécessaire après l’arrêt de la source sonore pour réduire le niveau de pression acoustique de 60dB.
- Le Score d’Opinion/Signification (ou Mean Opinion Score – MOS en anglais) : mesure la qualité de l’audio basé sur un jugement humain répliqué par des algorithmes d’apprentissage automatique.
- Les filtres supportés par notre AFE sont : passe-bas, passe-haut et passe-bande.
– Langage : Agnostique
– Entrée audio : flux et téléchargement de fichiers
– Taille du code SDK : 3MB
– Matériel pris en charge : Unités de microprocesseur
– Plateformes supportées :
- Windows – x86_64
- Linux – x86_64 | armv7hf | armv8
- Android 6.0 (API 23)
– Sur l’appareil
La technologie vocale embarquée est idéale pour les marques qui recherchent la commodité d’une interface vocale sans les problèmes de protection des données ou de connexion liés à Internet. L’accès complet à des commandes personnalisables et la possibilité de mettre les codes à jour pendant le développement facilitent la création de produits vocaux.
– Hybride
Le pouvoir de la connectivité Cloud combinée à la fiabilité de l’embarqué. Les solutions hybrides permettent à vos produits vocaux d’être à l’écoute et réactifs aux commandes à tout moment. Diffusez en toute transparence les mises à jour de vos produits et offrez une expérience vocale plus large grâce au niveau de connectivité Cloud qui correspond le mieux à votre produit et à vos utilisateurs.
Technologies Complémentaires
Découvrez les autres technologies de notre stack…
Mot déclencheur
Activez la reconnaissance vocale grâce à la détection d’un mot ou d’une phrase unique.
Reconnaissance vocale
Transforme la parole en données textuelles pouvant être traitées par les machines.
Biométrie vocale
Identifiez ou authentifiez les utilisateurs grâce à leur empreinte vocale.
Synthèse vocale
Convertissez vos données textuelles en vocaux réalistes en plusieurs langages et voix.
C'est toujours le bon moment pour en apprendre plus sur les applications de la technologie vocale
Surmontez la pénurie de main-d’œuvre grâce à la technologie : Focus sur la logistique, les TMS et les WMS
La pénurie mondiale de main-d'œuvre perturbe de nombreux secteurs, mais certains ressentent la pression plus fortement que d'autres. La logistique, la fabrication, la construction, la santé et le...