الإنتروبيا ليست كافية للتكيف في وقت الاختبار: من منظور العوامل المفصولة

تُعدّ التكيّف أثناء الاختبار (TTA) طريقة تُعدّل نماذج الشبكات العصبية العميقة المُدرّبة مسبقًا لتناسب بيانات الاختبار غير المرئية. وتشكل التحدي الرئيسي لـ TTA هو القيود المفروضة على الوصول إلى مجموعة بيانات الاختبار الكاملة أثناء التحديثات الحية، مما يؤدي إلى تراكم الأخطاء. وللتقليل من هذه المشكلة، استخدمت طرق TTA معامل الانتروبيا في مخرجات النموذج كمقياس للثقة، بهدف تحديد العينات التي منخفضة الاحتمال في التسبب بأخطاء. ومع ذلك، من خلال دراسات تجريبية، لاحظنا عدم موثوقية الانتروبيا كمقياس للثقة في سياقات متحيزة، وتم التوصل نظريًا إلى أن السبب يعود إلى إهمال تأثير العوامل المُفصّلة الخفية في البيانات على التنبؤات. استنادًا إلى هذه النتائج، نقدّم طريقة TTA جديدة تُسمّى "دمّر كائنك" (DeYO)، والتي تعتمد على مقياس ثقة جديد يُسمّى "الفرق في احتمالية التسمية الوهمية" (PLPD). يُقيّم PLPD تأثير شكل الكائن على التنبؤ من خلال قياس الفرق بين التنبؤات قبل وبعد تطبيق تحويل دمار الكائن. تتكون DeYO من خطوتين: اختيار العينات ووزن العينات، حيث تُستخدم الانتروبيا وPLPD معًا. ولضمان تكيّف قوي، تُعطي DeYO الأولوية للعينات التي تُضمّن بشكل أساسي معلومات الشكل عند إجراء التنبؤات. تُظهر التجارب الواسعة تفوق DeYO المستمر على الطرق الأساسية في سياقات متنوعة، بما في ذلك السياقات المتحيزة والبيئات الواقعية المعقدة. يمكن الوصول إلى صفحة المشروع بشكل عام عبر الرابط: https://whitesnowdrop.github.io/DeYO/.