16일 전
역방향 LSTM 신경망을 이용한 노이즈 제거 오토인코더를 활용한 자동 음성 신규성 탐지의 새로운 접근법
{Erik Marchi ; Fabio Vesperini ; Florian Eyben ; Stefano Squartini ; Björn Schuller}
초록
음향적 신기호 탐지(Acoustic novelty detection)는 시스템이 학습한 기준/정상 데이터와 다른 비정상 또는 새로운 음향 신호를 식별하는 것을 목표로 한다. 본 논문에서는 복원형 자동코드화기(denoising autoencoder)를 기반으로 한 새로운 비지도 학습 방법을 제안한다. 제안한 방법에서는 청각적 스펙트럼 특징이 양방향 Long Short-Term Memory(LSTM) 순환 신경망을 갖춘 복원형 자동코드화기로 처리된다. 자동코드화기의 입력과 출력 사이의 재구성 오차(reconstruction error)를 새로운 사건을 탐지하기 위한 활성화 신호로 사용한다. 자동코드화기는 일반적인 실내 상황(대화, 텔레비전 시청, 놀이, 식사 등)을 포함하는 공개 데이터베이스를 이용해 학습되었다. 평가는 260개 이상의 다양한 비정상 사건에 대해 수행되었으며, 최신 기술과의 비교를 통해 제안하는 새로운 방법이 기존 방법을 상당히 능가함을 확인하였다. 특히, 최대 93.4%의 F-측정(F-Measure)을 달성하여 우수한 성능을 보였다.