منذ 17 أيام
الكشف غير المراقب العميق عن الشذوذ
{Wen-Yan Lin, Siying Liu, Zheng Wang, Tangqing Li}

الملخص
تقدم هذه الورقة منهجية جديدة للكشف عن الانحرافات في مجموعات بيانات كبيرة ضمن بيئة غير مراقبة بالكامل. يكمن الفكرة الأساسية وراء خوارزميتنا في تعلّم التمثيل الكامن للبيانات الطبيعية. ولتحقيق ذلك، نستفيد من أحدث تقنيات التجميع المناسبة لمعالجة البيانات عالية الأبعاد. يوفر هذا الافتراض نقطة بداية موثوقة لاختيار البيانات الطبيعية. نُدرّب مُشفّرًا ذاتيًا (autoencoder) على مجموعة البيانات الطبيعية، ونكرّر عملية التخمين لاختيار مجموعة مرشحة طبيعية بناءً على التجميع وتعلّم التمثيل. ويُستخدم خطأ إعادة البناء الناتج عن المشفّر المُدرّب كدالة تقييم لتقييم درجة الطبيعية للبيانات. أظهرت النتائج التجريبية على عدة مجموعات بيانات معيارية عامة أن المنهجية المقترحة تتفوّق على أحدث التقنيات غير المراقبة، وتماثل تقنيات التعلم شبه المراقبة في معظم الحالات.