التصنيف الفرعي العميق للفئة الواحدة من خلال الوصفة الغاوسية المتداخلة

يهدف التصنيف من فئة واحدة (OCC) إلى تعلّم وصف فعّال للبيانات بحيث يحتوي جميع العينات التدريبية الطبيعية، ويكشف عن الشذوذ بناءً على الانحراف عن هذا الوصف. تتعلم النماذج الحالية الأفضل في مجال التصنيف من فئة واحدة وصفًا طبيعيًا مكثفًا من خلال تقليل حجم الكرة الفائقة (hyper-sphere minimisation)، لكنها غالبًا ما تعاني من التكيف الزائد (overfitting) مع بيانات التدريب، خاصةً عندما تكون مجموعة التدريب صغيرة أو ملوثة بعينات شاذة. لمعالجة هذه المشكلة، نقدّم طريقة الوصف الغاوسي المُدرج (IGD)، وهي نموذج جديد للتصنيف من فئة واحدة يتعلّم تصنيفًا شاذًا غاوسيًا من فئة واحدة، ويُدرّب باستخدام عينات تدريب مُعدّلة بطرق معاكسة (adversarially interpolated). يميّز تصنيف الشذوذ الغاوسي بين عينات التدريب بناءً على المسافة بينها وبين مركز التوزيع الغاوسي، وانحراف هذه المسافات، مما يمنح النموذج قدرة تمييزية (discriminability) تجاه العينات المعطاة أثناء التدريب. ويتم تطبيق التداخل المعاكس (adversarial interpolation) لضمان تعلّم وصف غاوسي ناعم باستمرار، حتى في حال كانت بيانات التدريب صغيرة أو ملوثة بعينات شاذة. وهذا يمكّن نموذجنا من تعلّم وصف البيانات بناءً على العينات الطبيعية الممثلة، وليس على العينات الحدودية أو الشاذة، ما يؤدي إلى تحسين كبير في وصف الطبيعة الطبيعية. وقد أظهرت تجارب واسعة على مجموعات معايير شائعة ومتنوعة، بما في ذلك MNIST وFashion MNIST وCIFAR10 وMVTec AD وبيانتين طبيتين، أن IGD تحقق دقة كشف أفضل من النماذج الحالية الأفضل في مجالها. كما تُظهر IGD أداءً أفضل في المقاومة للمشكلات التي تعاني من مجموعات تدريب صغيرة أو ملوثة. يُمكن الوصول إلى الكود من خلال الرابط: https://github.com/tianyu0207/IGD.