15일 전
혼합 신호를 위한 조건부 체인 매핑을 통한 시퀀스에서 다중 시퀀스 학습
Jing Shi, Xuankai Chang, Pengcheng Guo, Shinji Watanabe, Yusuke Fujita, Jiaming Xu, Bo Xu, Lei Xie

초록
신경 시퀀스-투-시퀀스 모델은 단일 입력 시퀀스를 단일 출력 시퀀스로 매핑하는 문제에 대해 잘 정립된 접근 방식이다. 본 연구에서는 하나의 입력 시퀀스로부터 여러 출력 시퀀스를 추출하는 일대다 시퀀스 변환 문제에 초점을 맞춘다. 예를 들어, 혼합 시퀀스에서 여러 개의 순차적 소스를 추출하는 경우가 이에 해당한다. 우리는 기존의 시퀀스-투-시퀀스 모델을 확장하여, 다중 출력 시퀀스 간의 관련성을 확률적 연쇄 법칙(Probabilistic Chain Rule)을 통해 명시적으로 모델링하는 조건부 다중 시퀀스 모델을 제안한다. 이 확장된 모델을 기반으로, 입력 시퀀스와 이미 추정된 이전 출력 시퀀스의 맥락 정보를 활용하여 출력 시퀀스를 순차적으로 조건부로 추론할 수 있다. 또한, 본 모델은 변환의 종료를 위한 간단하고 효율적인 정지 기준(stop criterion)을 갖추고 있어, 출력 시퀀스의 개수가 변할 수 있는 상황에서도 유연하게 대응할 수 있다. 음성 데이터를 주요 실험 영역으로 삼은 이유는 음파의 중첩 원리(상호중첩 원리)에 따라 관측되는 음성 데이터가 일반적으로 여러 소스의 조합으로 구성되기 때문이다. 음성 분리 및 다중 화자 음성 인식 등 다양한 작업에 대한 실험 결과에서, 제안한 조건부 다중 시퀀스 모델이 기존의 비조건부 모델보다 일관된 성능 향상을 보였음을 확인하였다.