تعقيد المدخلات وكشف التوزيعات غير المتشابهة باستخدام النماذج التوليدية القائمة على الاحتمال

النماذج التوليدية القائمة على الاحتمال تُعدّ موردًا واعدًا للكشف عن المدخلات الخارجة عن التوزيع (OOD) التي قد تُضعف متانة أو موثوقية نظام التعلم الآلي. ومع ذلك، أُظهر أن الاحتمالات المستمدة من هذه النماذج تُعاني من مشاكل في الكشف عن أنواع معينة من المدخلات التي تختلف بشكل كبير عن بيانات التدريب. في هذا البحث، نطرح فرضية أن السبب في هذه المشكلة يكمن في التأثير المفرط لتعقيد المدخلات على قيم الاحتمال في النماذج التوليدية. ونُقدّم مجموعة من التجارب التي تدعم هذه الفرضية، ونستخدم تقديرًا لتعقيد المدخلات لاستخلاص مؤشر فعّال وغير مُعتمد على معلمات للكشف عن المدخلات الخارجة عن التوزيع، والذي يمكن اعتباره نسبة احتمال، مشابهة لمقارنة النماذج بايزيّة. ونجد أن هذا المؤشر يُحقق أداءً مماثلًا أو حتى أفضل من الطرق الحالية للكشف عن المدخلات الخارجة عن التوزيع في مجموعة واسعة من مجموعات البيانات، والنماذج، وأحجام النماذج، وتقديرات التعقيد.