11일 전

비선형 예측을 위한 LSTM 순환 신경망을 활용한 음향 이상 탐지

{Erik Marchi ; Fabio Vesperini ; Felix Weninger ; Florian Eyben ; Stefano Squartini ; Björn Schuller}
초록

음향적 신기록 탐지(Acoustic novelty detection)는 시스템이 훈련된 기준/정상 데이터와 다른 비정상 또는 새로운 음향 신호를 식별하는 것을 목표로 한다. 본 논문에서는 비선형 예측 잡음 제거 오토인코더(non-linear predictive denoising autoencoders)를 기반으로 한 새로운 접근법을 제안한다. 제안한 방법에서는 장단기 기억(LSTM) 순환 잡음 제거 오토인코더를 활용하여 이전 프레임들로부터 다음 단기 프레임의 청각 스펙트럼 특징을 예측한다. 우리는 이 방법이 음성에 대해 효과적인 생성 모델을 제공함을 보여준다. 오토인코더의 입력과 출력 사이의 재구성 오차(reconstruction error)를 새로운 사건 탐지용 활성화 신호로 사용한다. 오토인코더는 대화, 텔레비전 시청, 놀이, 식사와 같은 일반적인 실내 상황을 포함하는 공개 데이터베이스를 이용해 훈련하였다. 평가는 260건 이상의 다양한 비정상 사건에 대해 수행되었으며, 최신 기술과의 비교를 통해 제안하는 새로운 접근법이 기존 방법을 크게 능가함을 입증하였으며, 최대 94.4%의 F-측정(F-Measure)을 달성하였다.

비선형 예측을 위한 LSTM 순환 신경망을 활용한 음향 이상 탐지 | 최신 연구 논문 | HyperAI초신경