Command Palette
Search for a command to run...
نموذج تصنيف وكشف الشذوذ الصوتي ثنائي المرحلة من التصنيف الأولي إلى الدقيق
نموذج تصنيف وكشف الشذوذ الصوتي ثنائي المرحلة من التصنيف الأولي إلى الدقيق
HyungWon Kim Odilbek Urmonov Rizwan Ali Shah
الملخص
تُعدّ النماذج الحالية القائمة على الشبكات العصبية التلافيفية (CNN) للكشف عن الشذوذ والتقسيم عرضة جدًا أو غير كافية في الحساسية تجاه الضوضاء، مما يؤدي إلى كشف غير كامل لأنماط الشذوذ أثناء مرحلة الاختبار. كما قد تميّز الطرق السابقة بين الصور الطبيعية والصورة غير الطبيعية، لكنها لا تستطيع تحديد موقع الشذوذ في الصور المختبرة بدقة عالية. ولحل هذه المشكلة، نقترح نموذجًا ثنائي المرحلة لتقسيم الشذوذ وكتلته بدقة متدرجة (من الخشن إلى الدقيق)، يُسمى (TASAD). في كلا المرحلتين، نُدرّب نموذجنا على مزيج من العينات الطبيعية وغير الطبيعية. وتُستمدّ الصور غير الطبيعية عن طريق إدخال أنماط شاذة افتراضية تم إنشاؤها تلقائيًا من صور مصادر الشذوذ. ونستخدم تقنية جديدة ومتقدمة لإدخال الشذوذ لإنتاج عينات شاذة متنوعة. في المرحلة الأولى، نصمم نموذج تقسيم شذوذ خشن (CAS) الذي يتلقى الصورة الكاملة كمدخل، بينما في المرحلة الثانية، نُدرّب نموذج تقسيم شذوذ دقيق (FAS) على قطع الصور. ويعمل نموذج FAS على تحسين أداء الكشف والتقسيم من خلال تحسين الأنماط الشاذة التي تم كشفها جزئيًا بواسطة نموذج CAS. وقد تم تدريب إطارنا على مجموعة بيانات MVTec، ومقارنتها بأساليب الحالة المتطورة (SOTA). ويؤدي المعمارية المقترحة إلى حجم نموذج مدمج – أصغر باربعة أضعاف مقارنة بالطريقة المتطورة، مع تحقيق دقة أفضل على مستوى البكسل. كما يمكن تطبيق TASAD على الأساليب المتطورة (SOTA) لتحسين أدائها في الكشف عن الشذوذ بشكل أكبر. تُظهر تجاربنا أن تطبيق TASAD على أحدث الطرق المتطورة يحسن أداء الدقة المتوسطة (AP) للطرق السابقة بنسبة 6.2٪. ولضمان قابلية إعادة الإنتاج، تم توفير الشفرة المصدرية على الرابط التالي: https://github.com/RizwanAliQau/tasad.git.