قاعدة مرجعية فعّالة لمقاومة الانزياح التوزيعي

الامتناع عن التنبؤ بثقة عند مواجهة أنواع من المدخلات تختلف عن تلك التي رُئيت أثناء التدريب يعد متطلبًا مهمًا لDeployment الآمن لأنظمة التعلم العميق. وعلى الرغم من بساطة صياغته، إلا أن هذا يُعد مشكلة بالغة الصعوبة في مجال التعلم العميق، حيث تميل النماذج إلى إصدار تنبؤات مفرطة في الثقة في مثل هذه الحالات. في هذا العمل، نقدّم نهجًا بسيطًا ولكن فعّالًا جدًا لمعالجة كشف العينات الخارجة عن التوزيع (out-of-distribution)، باستخدام مبدأ الامتناع: عند مواجهة عينة من فئة غير مرئية، يكون السلوك المرغوب هو الامتناع عن التنبؤ. يعتمد هذا النهج على شبكة عصبية تحتوي على فئة إضافية تُسمى "فئة الامتناع"، وتُدرّس على مجموعة بيانات تم توسيعها باستخدام مجموعة غير منظّمة تتضمن عددًا كبيرًا من العينات الخارجة عن التوزيع (OoD)، وتُعطى هذه العينات تسمية فئة الامتناع. ثم تُدرّس النموذج لتمييز فعّال بين العينات داخل التوزيع (in-distribution) والعينات الخارجة عن التوزيع. ونقارن هذا النهج البسيط نسبيًا مع مجموعة واسعة من الطرق المعقدة التي اُقترحت سابقًا للكشف عن العينات الخارجة عن التوزيع، وكذلك لنمذجة عدم اليقين في التعلم العميق، ونُثبت فعاليته تجريبيًا على مجموعة متنوعة من المعايير (benchmarks) والهياكل العميقة لتمييز الصور والتصنيف النصي، حيث يتفوق غالبًا على الطرق الحالية بفارق كبير. وبما أن هذا الأسلوب يتميز بالبساطة والفعالية، نقترح استخدامه كمبدأ مرجعي جديد إضافي للدراسات المستقبلية في هذا المجال.