
摘要
NeurST 是一个开源的神经语音翻译工具包,主要聚焦于端到端语音翻译任务。该工具包设计简洁、易于使用、可灵活修改与扩展,适用于先进的语音翻译研究及产品开发。NeurST 的目标是助力自然语言处理(NLP)研究人员推进语音翻译领域的研究,并构建可靠的基准测试体系。该工具包提供了从特征提取、数据预处理、分布式训练到评估的完整步骤指南。本文将详细介绍 NeurST 的框架设计,并展示其在多个基准数据集上的实验结果,这些结果可作为未来研究的可靠基线参考。NeurST 工具包已公开发布于 https://github.com/bytedance/neurst/,其性能将持续与其它相关方法及研究成果进行对比更新,相关进展可访问 https://st-benchmark.github.io/ 查看。