الختم المائي للكشف عن التوزيعات الخارجة عن التوزيع

تهدف كشف البيانات غير الموزعة (OOD) إلى تحديد البيانات غير الموزعة بناءً على التمثيلات المستخرجة من النماذج العميقة المدربة جيدًا. ومع ذلك، فإن الطرق الحالية تتجاهل إلى حد كبير خاصية إعادة البرمجة (reprogramming) للنماذج العميقة، وبالتالي قد لا تستغل بالكامل القوة الداخلية لهذه النماذج: فبدون تعديل المعاملات الخاصة بنموذج عميق مُدرَّب جيدًا، يمكننا إعادة برمجة هذا النموذج لتحقيق مهمة جديدة من خلال تلاعب على مستوى البيانات (مثل إضافة اضطراب مميز إلى الميزة). تُحفِّز هذه الخاصية على إعادة برمجة نموذج تصنيف ليصبح متميزًا في كشف OOD (مهمة جديدة)، ولهذا نقترح في هذه الورقة منهجية عامة تُسمى "العلامة المائية" (watermarking). وبشكل محدد، نتعلم نمطًا موحدًا يُضاف فوق تمثيلات البيانات الأصلية، حيث يزداد قدرة النموذج على الكشف بشكل كبير بعد تطبيق العلامة المائية. وتحقق التجارب الواسعة من فعالية هذه الطريقة، مما يُظهر الأهمية البالغة لخاصية إعادة البرمجة في النماذج العميقة عند كشف البيانات غير الموزعة.