11 天前
基于LSTM循环神经网络的非线性预测在声学新奇性检测中的应用
{Erik Marchi ; Fabio Vesperini ; Felix Weninger ; Florian Eyben ; Stefano Squartini ; Björn Schuller}
摘要
声学新奇检测旨在识别与系统训练所用参考/正常数据存在差异的异常或新颖声学信号。本文提出一种基于非线性预测去噪自编码器的新方法。在该方法中,利用长短期记忆(LSTM)循环去噪自编码器,从前序帧预测下一短时帧的听觉谱特征,从而构建一个有效的音频生成模型。通过自编码器输入与输出之间的重构误差作为激活信号,实现对新奇事件的检测。自编码器在包含典型居家场景(如交谈、看电视、玩耍和进食)录音的公开数据库上进行训练。评估在超过260种不同异常事件上进行。实验结果与当前最先进的方法进行对比,表明本方法显著优于现有技术,最高可达到94.4%的F-Measure。