17日前

NeurST:ニューラル音声翻訳ツールキット

Chengqi Zhao, Mingxuan Wang, Qianqian Dong, Rong Ye, Lei Li
NeurST:ニューラル音声翻訳ツールキット
要約

NeurSTはニューラル音声翻訳向けのオープンソースツールキットです。このツールキットは主にエンドツーエンド音声翻訳に焦点を当てており、使いやすく、カスタマイズおよび拡張が容易であり、先進的な音声翻訳研究や製品開発に活用できるよう設計されています。NeurSTの目的は、自然言語処理(NLP)研究者による音声翻訳分野の研究を支援すること、および本分野における信頼性の高いベンチマークの構築です。本ツールキットでは、特徴量抽出、データ前処理、分散学習、評価といった各ステップを段階的に示すレシピを提供しています。本論文では、NeurSTのフレームワーク設計を紹介し、さまざまなベンチマークデータセットにおける実験結果を提示します。これらの結果は、今後の研究における信頼できるベースラインと見なすことができます。ツールキットは公開されており、GitHubにて利用可能です(https://github.com/bytedance/neurst/)。また、NeurSTの性能は、他の手法や研究と比較して継続的に更新され、ベンチマークサイト(https://st-benchmark.github.io/)にて公開されます。