HyperAIHyperAI
منذ 11 أيام

فكّك MaxLogit للكشف عن التوزيعات غير الموزعة

{Xiang Xiang, Zihan Zhang}
فكّك MaxLogit للكشف عن التوزيعات غير الموزعة
الملخص

في تعلم الآلة، من الشائع ملاحظة أن التدريب القياسي يُنتج تأكيدًا مفرطًا للثقة بالنسبة لكلا نوعي البيانات: البيانات ضمن التوزيع (ID) والبيانات خارج التوزيع (OOD). وبالتالي، يُعدّ القدرة على كشف العينات الخارجة عن التوزيع أمرًا حاسمًا لتطبيق النموذج. ويشكل التصنيف بعد التدريب خطوة أساسية في كشف OOD. يُعدّ MaxLogit إحدى أبسط دوال التصنيف التي تستخدم أقصى قيم اللوغيت كمقياس للكشف عن OOD. ولتقديم منظور جديد لدراسة دوال التصنيف القائمة على اللوغيت، نعيد صياغة اللوغيت إلى مكونين: التشابه الكوسيني (cosine similarity) وطول اللوغيت (logit norm)، ونقترح استخدام MaxCosine وMaxNorm بدلًا من ذلك. ووجدنا تجريبيًا أن MaxCosine يُعدّ العامل المحوري في كفاءة MaxLogit، في حين أن أداء MaxLogit يُعَاقَد بسبب MaxNorm. ولحل هذه المشكلة، نقترح طريقة تُسمى Decoupling MaxLogit (DML) تُتيح مرونة في التوازن بين MaxCosine وMaxNorm. ولتعزيز التعبير عن الجوهر الأساسي لطريقتنا، نوسع DML إلى DML+ استنادًا إلى رؤى جديدة تُظهر أن عدد العينات الصعبة القليل ووجود فضاء مميزات مكثف هما العنصرين الأساسيين لجعل الطرق القائمة على اللوغيت فعالة. ونُظهر فعالية طرقنا القائمة على اللوغيت للكشف عن OOD على مجموعات بيانات CIFAR-10 وCIFAR-100 وImageNet، ونُحقّق أداءً يُعدّ من أفضل الأداءات المُسجّلة في المجال.

فكّك MaxLogit للكشف عن التوزيعات غير الموزعة | أحدث الأوراق البحثية | HyperAI