HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

فكّك MaxLogit للكشف عن التوزيعات غير الموزعة

{Xiang Xiang Zihan Zhang}

فكّك MaxLogit للكشف عن التوزيعات غير الموزعة

الملخص

في تعلم الآلة، من الشائع ملاحظة أن التدريب القياسي يُنتج تأكيدًا مفرطًا للثقة بالنسبة لكلا نوعي البيانات: البيانات ضمن التوزيع (ID) والبيانات خارج التوزيع (OOD). وبالتالي، يُعدّ القدرة على كشف العينات الخارجة عن التوزيع أمرًا حاسمًا لتطبيق النموذج. ويشكل التصنيف بعد التدريب خطوة أساسية في كشف OOD. يُعدّ MaxLogit إحدى أبسط دوال التصنيف التي تستخدم أقصى قيم اللوغيت كمقياس للكشف عن OOD. ولتقديم منظور جديد لدراسة دوال التصنيف القائمة على اللوغيت، نعيد صياغة اللوغيت إلى مكونين: التشابه الكوسيني (cosine similarity) وطول اللوغيت (logit norm)، ونقترح استخدام MaxCosine وMaxNorm بدلًا من ذلك. ووجدنا تجريبيًا أن MaxCosine يُعدّ العامل المحوري في كفاءة MaxLogit، في حين أن أداء MaxLogit يُعَاقَد بسبب MaxNorm. ولحل هذه المشكلة، نقترح طريقة تُسمى Decoupling MaxLogit (DML) تُتيح مرونة في التوازن بين MaxCosine وMaxNorm. ولتعزيز التعبير عن الجوهر الأساسي لطريقتنا، نوسع DML إلى DML+ استنادًا إلى رؤى جديدة تُظهر أن عدد العينات الصعبة القليل ووجود فضاء مميزات مكثف هما العنصرين الأساسيين لجعل الطرق القائمة على اللوغيت فعالة. ونُظهر فعالية طرقنا القائمة على اللوغيت للكشف عن OOD على مجموعات بيانات CIFAR-10 وCIFAR-100 وImageNet، ونُحقّق أداءً يُعدّ من أفضل الأداءات المُسجّلة في المجال.

المعايير القياسية

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
فكّك MaxLogit للكشف عن التوزيعات غير الموزعة | الأوراق البحثية | HyperAI