11日前

LSTM再帰型ニューラルネットワークを用いた非線形予測による音響ノベルティ検出

{Erik Marchi ; Fabio Vesperini ; Felix Weninger ; Florian Eyben ; Stefano Squartini ; Björn Schuller}
要約

音響ノイズ検出(Acoustic novelty detection)は、システムが訓練された参照/正常データとは異なる異常または新規の音響信号を識別することを目的としている。本論文では、非線形予測デノイジングオートエンコーダーを基盤とする新たなアプローチを提案する。本手法では、長短期記憶(LSTM)再帰型デノイジングオートエンコーダーを用いて、過去のフレームから次の短時間フレームの聴覚的スペクトル特徴を予測する。本手法が音声の有効な生成モデルとして機能することを示す。オートエンコーダーの入力と出力の再構成誤差を、新規イベント検出の活性化信号として用いる。オートエンコーダーは、会話、テレビ視聴、遊具使用、食事など、一般的な家庭内状況を収録した公開データベースを用いて学習された。評価は260種類以上の異常イベントに対して実施された。最先端手法と比較した結果、本手法は最大94.4%のF-Measureを達成し、既存の手法を著しく上回ることが確認された。

LSTM再帰型ニューラルネットワークを用いた非線形予測による音響ノベルティ検出 | 最新論文 | HyperAI超神経