HyperAIHyperAI

Command Palette

Search for a command to run...

فكّك MaxLogit للكشف عن التوزيعات غير الموزعة

Xiang Xiang Zihan Zhang

الملخص

في تعلم الآلة، من الشائع ملاحظة أن التدريب القياسي يُنتج تأكيدًا مفرطًا للثقة بالنسبة لكلا نوعي البيانات: البيانات ضمن التوزيع (ID) والبيانات خارج التوزيع (OOD). وبالتالي، يُعدّ القدرة على كشف العينات الخارجة عن التوزيع أمرًا حاسمًا لتطبيق النموذج. ويشكل التصنيف بعد التدريب خطوة أساسية في كشف OOD. يُعدّ MaxLogit إحدى أبسط دوال التصنيف التي تستخدم أقصى قيم اللوغيت كمقياس للكشف عن OOD. ولتقديم منظور جديد لدراسة دوال التصنيف القائمة على اللوغيت، نعيد صياغة اللوغيت إلى مكونين: التشابه الكوسيني (cosine similarity) وطول اللوغيت (logit norm)، ونقترح استخدام MaxCosine وMaxNorm بدلًا من ذلك. ووجدنا تجريبيًا أن MaxCosine يُعدّ العامل المحوري في كفاءة MaxLogit، في حين أن أداء MaxLogit يُعَاقَد بسبب MaxNorm. ولحل هذه المشكلة، نقترح طريقة تُسمى Decoupling MaxLogit (DML) تُتيح مرونة في التوازن بين MaxCosine وMaxNorm. ولتعزيز التعبير عن الجوهر الأساسي لطريقتنا، نوسع DML إلى DML+ استنادًا إلى رؤى جديدة تُظهر أن عدد العينات الصعبة القليل ووجود فضاء مميزات مكثف هما العنصرين الأساسيين لجعل الطرق القائمة على اللوغيت فعالة. ونُظهر فعالية طرقنا القائمة على اللوغيت للكشف عن OOD على مجموعات بيانات CIFAR-10 وCIFAR-100 وImageNet، ونُحقّق أداءً يُعدّ من أفضل الأداءات المُسجّلة في المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp