HyperAIHyperAI

Command Palette

Search for a command to run...

استغلال التغيرات في توزيع التسميات الهرمية في التعرف على الذيل الطويل دون معرفة الاختبار

Zhiyong Yang Qianqian Xu Zitai Wang Sicong Li Boyu Han Shilong Bao Xiaochun Cao Qingming Huang

الملخص

يستكشف هذا البحث التعرف على ذيل طويل بغض النظر عن الاختبار (test-agnostic long-tail recognition)، وهو مهمة صعبة حيث تكون توزيعات العلامات في الاختبار غير معروفة وغير متوازنة بشكل تعسفي. نعتقد أن هذه التباينات يمكن تقسيمها بطريقة هرمية إلى مستويات عالمية و محلية. المستويات العالمية تعكس نطاقًا واسعًا من التنوع، بينما تنشأ المستويات المحلية غالبًا من تغييرات خفيفة، غالبًا ما تكون مركزة حول جارٍ محدد. يعتمد معظم الطرق التقليدية على أسلوب مزيج الخبراء (Mixture-of-Expert - MoE)، مستهدفًا بعض التوزيعات الثابتة للعلامات في الاختبار التي تظهر تباينات عالمية كبيرة. ومع ذلك، يتم إهمال التباينات المحلية. لمعالجة هذه المشكلة، نقترح استراتيجية جديدة لمزيج الخبراء، وهي DirMixE\mathsf{DirMixE}DirMixE، والتي تقوم بتخصيص الخبراء لتوزيعات ديراكليت (Dirichlet) الميتا المختلفة للتوزيع العلامة، كل منها يستهدف جانبًا محددًا من التباينات المحلية. بالإضافة إلى ذلك، فإن التنوع بين هذه التوزيعات الميتا لديراكليت يلتقط بشكل ذاتي التباينات العالمية. يؤدي هذا النهج ذو المستوى المزدوج أيضًا إلى دالة هدف أكثر استقرارًا، مما يسمح لنا بعينة أفضل من توزيعات الاختبار المختلفة لتقدير المتوسط والتفاوت في نتائج الأداء. نظريًا، نوضح أن الهدف المقترح يستفيد من تعميم محسن بفضل التنظيم القائم على التفاوت. تؤكد التجارب الشاملة عبر العديد من مقاييس الأداء فعالية DirMixE\mathsf{DirMixE}DirMixE. يمكن الحصول على الكود من \url{https://github.com/scongl/DirMixE}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp