15일 전
음성 분리의 레이블 할당 안정화를 위한 자기지도 학습 기반 사전 훈련
Sung-Feng Huang, Shun-Po Chuang, Da-Rong Liu, Yi-Chen Chen, Gene-Ping Yang, Hung-yi Lee

초록
음성 분리 기술은 매우 성공적인 순열 불변 훈련(Permutation Invariant Training, PIT) 방법을 통해 크게 발전해 왔지만, 더 빠른 수렴 속도와 향상된 성능을 기대할 때 PIT 훈련 과정에서 발생하는 레이블 할당 전환 문제는 여전히 해결해야 할 과제로 남아 있다. 본 논문에서는 음성 분리 모델 훈련 시 레이블 할당을 안정화하기 위해 자기지도 학습(self-supervised pre-training)을 도입하는 방법을 제안한다. 다양한 자기지도 학습 방법, 대표적인 음성 분리 모델 및 두 가지 다른 데이터셋을 대상으로 수행한 실험 결과, 적절한 자기지도 학습 방법을 선택할 경우 매우 우수한 성능 향상이 가능함을 확인할 수 있었다.