التنبؤ غير الخطي باستخدام الشبكات العصبية التكرارية LSTM للكشف عن الجديد الصوتي
يهدف الكشف عن الأحداث الصوتية غير المألوفة إلى تحديد الإشارات الصوتية غير العادية/الجديدة التي تختلف عن البيانات المرجعية/العادية التي تم تدريب النظام عليها. في هذه الورقة، نقدم منهجية جديدة تعتمد على مُشفّرات تصفية الضوضاء التنبؤية غير الخطية. في منهجيتنا، يتم التنبؤ بسمات الطيف الصوتي للإطار القصير الأمد التالي من خلال الإطارات السابقة باستخدام مُشفّرات التصفية التنبؤية ذات الذاكرة الطويلة والقصيرة (LSTM). ونُظهر أن هذا النهج يُنتج نموذجًا توليديًا فعّالًا للصوت. ويُستخدم خطأ إعادة البناء بين المدخل والمخرج في المُشفّر كإشارة تنشيط للكشف عن الأحداث الجديدة. وتم تدريب المُشفّر على قاعدة بيانات عامة تحتوي على تسجيلات لحالات منزلية شائعة مثل الحديث، ومشاهدة التلفاز، واللعب، والأكل. وتم إجراء التقييم على أكثر من 260 حدثًا غير عادي مختلف. ونقارن النتائج مع الطرق الرائدة في المجال، ونتوصل إلى أن منهجيتنا الجديدة تفوق بشكل ملحوظ الطرق الحالية، حيث تحقق ما يصل إلى 94.4% من معامل F.