التدريب التمييزي لتحسين الكشف عن التوزيعات غير الموزعة

يُدرَك بشكل متزايد أن الكشف الموثوق عن المدخلات التي تقع خارج التوزيع (OOD) يُعد شرطًا مسبقًا لتنفيذ أنظمة التعلم الآلي. تقدم هذه الورقة وتحلل استخدام التدريب التبايني لتعزيز أداء الكشف عن OOD. على عكس الأساليب الرائدة في الكشف عن OOD، لا يتطلب نهجنا الوصول إلى أمثلة مُعلَّمة صراحةً على أنها OOD، وهو ما قد يكون صعبًا في التطبيق العملي. ونُظهر من خلال تجارب واسعة أن التدريب التبايني يُسهم بشكل كبير في تحسين أداء الكشف عن OOD على عدد من المعايير الشائعة. وباستخدام وتقديم مؤشر "الاحتمال اللوغاريتمي للالتباس" (CLP)، الذي يقيس صعوبة مهمة الكشف عن OOD من خلال قياس درجة التشابه بين مجموعتي البيانات الداخلة (inlier) والخارجة (outlier)، نُظهر أن طريقةنا تُحسّن الأداء بشكل خاص في فئات "الـ OOD القريبة" – وهي حالة خاصة بالغة الصعوبة بالنسبة للأساليب السابقة.