كشف الشذوذ من خلال تحليل المكون الرئيسي المُعدّل بالاستSampling
الملخص: تمثل كشف القيم الشاذة مشكلة مهمة في تنقيب البيانات، وقد تم دراستها في مجالات بحثية مختلفة. يمكن استخدامها للكشف عن كميات صغيرة من البيانات المُنحرفة. في هذه المقالة، نستخدم إجراء "إبقاء نقطة واحدة خارج" (Leave One Out) للتحقق من التأثير "الحالي أو غير الحاضر" لكل نقطة فردية على تغير الاتجاهات الرئيسية. استنادًا إلى هذه الفكرة، تم اقتراح طريقة جديدة للكشف عن القيم الشاذة تعتمد على تحليل المكونات الرئيسية مع تكثيف العينات (Over-sampling Principal Component Analysis)، بهدف التأكيد على تأثير المثال غير الطبيعي (أو القيمة الشاذة). إلى جانب تحديد القيم الشاذة المشبوهة، قمنا أيضًا بتصميم نظام كشف شذوذ آني (On-line Anomaly Detection) للكشف عن الشذوذ الجديدة التي تصل تدريجيًا. بالإضافة إلى ذلك، درسنا تحديثًا سريعًا للاتجاهات الرئيسية، مما يضمن الحساب الفعّال ويحقق متطلبات الكشف الآني. وأظهرت التجارب العددية أن الطريقة المقترحة فعّالة من حيث وقت الحساب وكفاءة كشف الشذوذ.