نهج جديد للكشف التلقائي عن الأصوات الغريبة باستخدام مُشفِّر ذاتي لتنقية الضوضاء مع شبكات عصبية LSTM ذات اتجاهين
تهدف الكشف عن التغير الصوتي إلى تحديد الإشارات الصوتية غير الطبيعية/الجديدة التي تختلف عن البيانات المرجعية/الطبيعية التي تم تدريب النظام عليها. في هذه الورقة، نقدّم نهجًا غير مُراقب جديدًا يقوم على استخدام مُفكّك تلقائي للضوضاء (Denoising Autoencoder). في نهجنا، يتم معالجة السمات الطيفية السمعية بواسطة مُفكّك تلقائي للضوضاء مدعوم بشبكات عصبية متكررة من نوع ذاكرة طويلة قصيرة (LSTM) ثنائية الاتجاه. ونستخدم خطأ إعادة البناء بين المدخل والمخرج في المُفكّك كإشارة نشاط لاكتشاف الأحداث الجديدة. تم تدريب المُفكّك على قاعدة بيانات عامة تحتوي على تسجيلات لحالات منزلية شائعة مثل الحديث، ومشاهدة التلفاز، واللعب، والأكل. تم إجراء التقييم على أكثر من 260 حدثًا غير طبيعي مختلف. ونقارن النتائج مع الطرق الرائدة في مجالها، ونستنتج أن النهج الجديد لدينا يتفوق بشكل ملحوظ على الطرق الحالية، حيث يحقق ما يصل إلى 93.4% من قياس F.