ViM: خارج التوزيع مع مطابقة اللوغاريت الوهمي

تعتمد معظم الخوارزميات الحالية الكشف عن التوزيع الخارجي (OOD) على مصدر إدخال واحد فقط: الميزة، أو الـlogit، أو احتمالية الـsoftmax. ومع ذلك، فإن التنوّع الهائل في أمثلة OOD يجعل هذه الأساليب هشّة. فهناك أمثلة OOD تُعدّ سهلة التمييز في فضاء الميزات، لكنها صعبة التمييز في فضاء الـlogit، والعكس صحيح. مستوحى من هذه الملاحظة، نقترح طريقة جديدة لتقييم OOD تُسمى "مطابقة الـlogit الافتراضي" (Virtual-logit Matching - ViM)، والتي تجمع بين القيمة المُجرّدة من فضاء الميزات والـlogits المعتمدة على الفئة في البيانات الداخلة (ID). بشكل محدد، يتم إنشاء Logit إضافي يمثّل فئة OOD افتراضية من خلال باقي الميزة بالنسبة للفضاء الرئيسي، ثم يتم مطابقته مع الـlogits الأصلية باستخدام عامل تكبير ثابت. وتمثل الاحتمال الناتج عن هذا الـlogit الافتراضي بعد تطبيق الـsoftmax مؤشّرًا على درجة OOD. ولتسهيل تقييم الكشف عن OOD على نطاق واسع في الأوساط الأكاديمية، قمنا بإنشاء مجموعة بيانات جديدة لـ ImageNet-1K، تم تسميتها يدويًا، وحجمها 8.8 مرة أكبر من المجموعات المتاحة حاليًا. أجرينا تجارب واسعة تشمل الشبكات العصبية التلافيفية (CNNs) والمحولات البصرية (Vision Transformers) لإثبات فعالية القياس المُقترح ViM. وباستخدام نموذج BiT-S، حققنا متوسط قيمة AUROC بلغت 90.91٪ على أربع معايير صعبة للكشف عن OOD، متفوّقًا بنسبة 4٪ على أفضل نموذج مقارن. يمكن الوصول إلى الكود والبيانات من خلال الرابط: https://github.com/haoqiwang/vim.