التوجيه القريبة من الجيران للكشف عن التوزيعات غير الموزونة

كما أن الكشف عن العينات الخارجة عن التوزيع (OOD) يُعد أمرًا بالغ الأهمية للنماذج المستندة إلى التعلم الآلي عند تطبيقها في بيئات مفتوحة. تُعتبر الدرجات المستندة إلى الفاصل (classifier-based scores) النهج القياسي للكشف عن OOD بفضل قدرتها على الكشف الدقيق. ومع ذلك، غالبًا ما تعاني هذه الدرجات من مشكلة التأكيد الزائد (overconfidence)، مما يؤدي إلى تصنيف عينات OOD التي تبعد كثيرًا عن المنطقة ذات التوزيع الداخلي (ID) بشكل خاطئ. ولحل هذه التحديات، نقترح طريقة تُسمى "التوجيه بواسطة الجيران الأقرب" (Nearest Neighbor Guidance أو NNGuide)، التي توجه الدرجة المستندة إلى الفاصل لاحترام البنية الهندسية لسطح البيانات (data manifold). تقلل NNGuide من تأكيد العينات الخارجة عن التوزيع بشكل مفرط مع الحفاظ على القدرة الدقيقة للدرجات المستندة إلى الفاصل. أجرينا تجارب واسعة النطاق على معايير كشف OOD في ImageNet تحت ظروف متنوعة، بما في ذلك سيناريو يتضمن تغيرًا طبيعيًا في توزيع البيانات الداخلية (ID). أظهرت النتائج أن NNGuide تحقق تحسينًا كبيرًا في أداء الدرجات الأساسية للكشف، وتحقيق نتائج رائدة على جميع مقاييس AUROC وFPR95 وAUPR. يُمكن الاطلاع على الكود من خلال الرابط التالي: \url{https://github.com/roomo7time/nnguide}.