2달 전
확률적 계층을 가진 순환 신경망을 이용한 음향 신규성 검출
Nguyen, Duong ; Kirsebom, Oliver S. ; Frazão, Fábio ; Fablet, Ronan ; Matwin, Stan

초록
본 논문에서는 텍스트, 음악 및 음성 생성에 있어 최신 기술인 확률적 계층을 갖춘 순환 신경망(Recurrent Neural Networks with Stochastic Layers)을 소리의 새로운 특성 탐지 문제에 적용합니다. 이 네트워크는 숨겨진 상태에 불확실성을 통합함으로써 복잡한 시퀀스의 분포를 학습할 수 있습니다. 학습된 분포가 확률로 명시적으로 계산될 수 있으므로, 관찰치가 얼마나 가능성이 있는지를 평가하고 낮은 확률 사건을 새로운 것으로 탐지할 수 있습니다. 본 모델은 견고하며, 고도로 비지도학습적이며, 엔드투엔드 방식이며 최소한의 전처리, 특성 공학 또는 하이퍼파라미터 조정이 필요합니다. 벤치마크 데이터셋에서 수행된 실험 결과, 본 모델이 최신 소리의 새로운 특성 탐지기보다 우수한 성능을 보임을 확인할 수 있었습니다.