HyperAIHyperAI
il y a 17 jours

NeurST : Ensemble d'outils de traduction vocale neuronale

Chengqi Zhao, Mingxuan Wang, Qianqian Dong, Rong Ye, Lei Li
NeurST : Ensemble d'outils de traduction vocale neuronale
Résumé

NeurST est un outil open-source dédié à la traduction automatique de parole par des modèles neuronaux. Ce cadre de travail se concentre principalement sur la traduction vocale end-to-end, conçu pour être facile à utiliser, à modifier et à étendre dans le cadre de recherches avancées en traduction vocale ainsi que de développements produits. L’objectif de NeurST est de faciliter la recherche en traduction vocale pour les chercheurs en traitement du langage naturel (NLP) et de fournir des références fiables pour ce domaine. Il propose des procédures étape par étape pour l’extraction de caractéristiques, le prétraitement des données, l’entraînement distribué et l’évaluation. Dans cet article, nous présentons la conception architecturale de NeurST et exposons les résultats expérimentaux obtenus sur plusieurs jeux de données de référence, qui peuvent servir de bases fiables pour les travaux futurs. L’outil est disponible publiquement à l’adresse suivante : https://github.com/bytedance/neurst/, et nous mettrons régulièrement à jour les performances de NeurST par rapport à d’autres approches et études sur le site : https://st-benchmark.github.io/.

NeurST : Ensemble d'outils de traduction vocale neuronale | Articles de recherche récents | HyperAI