HyperAIHyperAI
منذ 2 أشهر

استغلال التغيرات في توزيع التسميات الهرمية في التعرف على الذيل الطويل دون معرفة الاختبار

Zhiyong Yang; Qianqian Xu; Zitai Wang; Sicong Li; Boyu Han; Shilong Bao; Xiaochun Cao; Qingming Huang
استغلال التغيرات في توزيع التسميات الهرمية في التعرف على الذيل الطويل دون معرفة الاختبار
الملخص

يستكشف هذا البحث التعرف على ذيل طويل بغض النظر عن الاختبار (test-agnostic long-tail recognition)، وهو مهمة صعبة حيث تكون توزيعات العلامات في الاختبار غير معروفة وغير متوازنة بشكل تعسفي. نعتقد أن هذه التباينات يمكن تقسيمها بطريقة هرمية إلى مستويات عالمية و محلية. المستويات العالمية تعكس نطاقًا واسعًا من التنوع، بينما تنشأ المستويات المحلية غالبًا من تغييرات خفيفة، غالبًا ما تكون مركزة حول جارٍ محدد. يعتمد معظم الطرق التقليدية على أسلوب مزيج الخبراء (Mixture-of-Expert - MoE)، مستهدفًا بعض التوزيعات الثابتة للعلامات في الاختبار التي تظهر تباينات عالمية كبيرة. ومع ذلك، يتم إهمال التباينات المحلية. لمعالجة هذه المشكلة، نقترح استراتيجية جديدة لمزيج الخبراء، وهي $\mathsf{DirMixE}$، والتي تقوم بتخصيص الخبراء لتوزيعات ديراكليت (Dirichlet) الميتا المختلفة للتوزيع العلامة، كل منها يستهدف جانبًا محددًا من التباينات المحلية. بالإضافة إلى ذلك، فإن التنوع بين هذه التوزيعات الميتا لديراكليت يلتقط بشكل ذاتي التباينات العالمية. يؤدي هذا النهج ذو المستوى المزدوج أيضًا إلى دالة هدف أكثر استقرارًا، مما يسمح لنا بعينة أفضل من توزيعات الاختبار المختلفة لتقدير المتوسط والتفاوت في نتائج الأداء. نظريًا، نوضح أن الهدف المقترح يستفيد من تعميم محسن بفضل التنظيم القائم على التفاوت. تؤكد التجارب الشاملة عبر العديد من مقاييس الأداء فعالية $\mathsf{DirMixE}$. يمكن الحصول على الكود من \url{https://github.com/scongl/DirMixE}.

استغلال التغيرات في توزيع التسميات الهرمية في التعرف على الذيل الطويل دون معرفة الاختبار | أحدث الأوراق البحثية | HyperAI