
초록
NeurST는 신경망 기반 음성 번역을 위한 오픈소스 툴킷이다. 이 툴킷은 주로 엔드투엔드 음성 번역에 초점을 맞추고 있으며, 사용하기 쉽고, 수정 및 확장이 용이하여 고급 음성 번역 연구 및 제품 개발에 적합하다. NeurST는 자연어처리(NLP) 연구자들이 음성 번역 분야의 연구를 보다 쉽게 수행할 수 있도록 지원하고, 이 분야에 신뢰할 수 있는 벤치마크를 구축하는 것을 목표로 한다. 툴킷은 특징 추출, 데이터 전처리, 분산 학습, 평가까지 단계별 레시피를 제공한다. 본 논문에서는 NeurST의 프레임워크 설계를 소개하고, 다양한 벤치마크 데이터셋에 대한 실험 결과를 제시하며, 향후 연구를 위한 신뢰할 수 있는 기준으로 활용될 수 있는 성능을 보여준다. 툴킷은 공개적으로 제공되며, GitHub 주소는 https://github.com/bytedance/neurst/이며, NeurST의 성능은 다른 대응 모델 및 연구들과 비교하여 지속적으로 업데이트될 예정이며, 그 정보는 https://st-benchmark.github.io/ 에서 확인할 수 있다.