HyperAIHyperAI
منذ 17 أيام

الغابة العميقة المعزولة للكشف عن الشذوذ

Hongzuo Xu, Guansong Pang, Yijie Wang, Yongjun Wang
الغابة العميقة المعزولة للكشف عن الشذوذ
الملخص

أصبحت "غابة العزلة" (iForest) على نحو ملحوظ واحدة من أكثر أدوات الكشف عن الشذوذ شيوعًا في السنوات الأخيرة، بفضل فعاليتها العامة عبر مختلف المعايير والقدرة القوية على التوسع. ومع ذلك، فإن طريقة العزل الموازية للمحاور الخطية التي تعتمدها غالبًا ما تؤدي إلى (أ) فشل في اكتشاف الشذوذ الصعبة التي يصعب عزلها في فضاءات البيانات عالية الأبعاد أو غير القابلة للفصل الخطي، و(ب) انحياز خوارزمي شهير يُخصّص درجات شذوذ منخفضة بشكل غير متوقع مناطق الشذوذ الاصطناعية. تساهم هذه المشكلات في حدوث أخطاء عالية في التقليل من الشذوذ الحقيقي (الخطأ من النوع الثاني). تم اقتراح عدة توسيعات لـ iForest، لكنها تظل في جوهرها تعتمد على تقسيم بيانات سطحي وخطي، مما يحد من قدرتها على عزل الشذوذ الحقيقي. لذلك، تقدم هذه الورقة نموذج "غابة العزلة العميقة" (Deep Isolation Forest). نُقدّم Scheme تمثيل جديدًا يستخدم شبكات عصبية مُهيأة بشكل عشوائي لتحويل البيانات الأصلية إلى مجموعات تمثيل عشوائية، حيث تُطبّق بعدها قطوع موازية للمحاور عشوائيًا لإجراء تقسيم البيانات. يُسهّل هذا النموذج تمثيلي حرية عالية في التقسيم ضمن فضاء البيانات الأصلي (وهو ما يعادل تقسيمًا غير خطي على فضاءات فرعية بأحجام مختلفة)، مما يُشجع على تآزر فريد بين التمثيلات العشوائية وعزل البيانات القائم على التقسيم العشوائي. تُظهر التجارب الواسعة أن نموذجنا يحقق تحسينًا ملحوظًا مقارنةً بأفضل الطرق القائمة على العزل وأفضل النماذج العميقة على مجموعات بيانات جدولية ورسومية وسلسلة زمنية، كما أن نموذجنا يرث الخصائص المرغوبة من حيث التوسعية من iForest.

الغابة العميقة المعزولة للكشف عن الشذوذ | أحدث الأوراق البحثية | HyperAI