18일 전
IWSLT 2020를 위한 모달리티 무관 메타러닝을 활용한 엔드투엔드 오프라인 음성 번역 시스템
{Sangha Kim, Sathish Reddy Indurthi, Mohd Abbas Zaidi, Nikhil Kumar Lakumarapu, Hou Jeung Han, Beomseok Lee}

초록
본 논문에서는 IWSLT 2020 오프라인 음성 번역 과제에 제출한 시스템에 대해 설명한다. 우리는 엔드투엔드 음성-to-텍스트 번역(이하 ST) 시스템을 구축하기 위해 Transformer 아키텍처와 메타학습(Meta-learning) 접근법을 결합하였다. 본 연구에서 제안하는 메타학습 접근법은 음성 번역 과제의 데이터 부족 문제를 해결하기 위해 자동 음성 인식(ASR) 및 기계 번역(MT) 과제에서 활용 가능한 데이터를 효과적으로 활용한다. 특히 메타학습 접근법과 합성 데이터 증강 기법을 결합함으로써 모델 성능이 크게 향상되었으며, IWSLT 테스트 2015, MuST-C 테스트, Europarl-ST 테스트 세트에서 각각 BLEU 점수 24.58, 27.51, 27.61을 달성하였다.