HyperAIHyperAI
منذ 8 أيام

التجميع التلقائي المتنوع للخبراء لتمييز التوزيع الطويل التردد غير المُعتمد على الاختبار

Yifan Zhang, Bryan Hooi, Lanqing Hong, Jiashi Feng
التجميع التلقائي المتنوع للخبراء لتمييز التوزيع الطويل التردد غير المُعتمد على الاختبار
الملخص

تُركّز الطرق الحالية لتمييز التوزيع الطويل الذيل (long-tailed recognition) على تدريب نماذج متوازنة من حيث الفئات من بيانات ذات توزيع طويل الذيل، مع افتراض عمومي بأن النماذج ستُختبر على توزيع فئات موحد في مرحلة الاختبار. ومع ذلك، فإن التوزيعات الفعلية للفئات في البيئة الامتحانية غالبًا ما تنتهك هذا الافتراض (مثلاً، تكون طويلة الذيل أو حتى عكسية الطول الذيل)، مما قد يؤدي إلى فشل هذه الطرق في التطبيقات الواقعية. في هذه الورقة، ندرس مهمة أكثر واقعية ولكنها أكثر تحديًا، تُسمى التمييز الطويل الذيل المستقل عن الاختبار (test-agnostic long-tailed recognition)، حيث يكون توزيع الفئات في البيانات التدريبية طويل الذيل، بينما يكون توزيع الفئات في البيانات الامتحانية غير معروف (agnostic) وليس بالضرورة موحدًا. إلى جانب مشكلة عدم التوازن بين الفئات، تفرض هذه المهمة تحديًا إضافيًا: عدم معرفة التحول في توزيع الفئات بين البيانات التدريبية والامتحانية. لمعالجة هذه المهمة، نقترح منهجية جديدة تُسمى "تجميع خبراء متنوعين ذاتيًا" (Self-supervised Aggregation of Diverse Experts)، والتي تتضمن استراتيجيتين: (1) استراتيجية جديدة لتعلم خبراء متنوعين من حيث المهارات، تُدرّب عدة خبراء من مجموعة بيانات تدريب واحدة ثابتة وطويلة الذيل، بحيث تُعالج كل خبير توزيعات فئات مختلفة بشكل منفصل؛ (2) استراتيجية جديدة لجمع الخبراء أثناء وقت الاختبار، تستخدم التعلم الذاتي (self-supervision) لدمج الخبراء المتعددة المُدرّبة لمعالجة توزيعات فئات امتحانية غير معروفة. نُظهر نظريًا أن استراتيجيتنا ذاتية التعلم تمتلك قدرة مثبتة على محاكاة توزيعات فئات مستقلة عن الاختبار. وتُظهر النتائج التجريبية الواعدة فعالية منهجنا في كلا النوعين من التمييز الطويل الذيل: التقليدي والمستقل عن الاختبار. يُتاح الكود على الرابط التالي: \url{https://github.com/Vanint/SADE-AgnosticLT}.

التجميع التلقائي المتنوع للخبراء لتمييز التوزيع الطويل التردد غير المُعتمد على الاختبار | أحدث الأوراق البحثية | HyperAI