HyperAIHyperAI
منذ 9 أيام

التعرف على التوزيع الطويل الذيل من خلال توجيه خبراء متنوعين واعين للتوزيع

Xudong Wang, Long Lian, Zhongqi Miao, Ziwei Liu, Stella X. Yu
التعرف على التوزيع الطويل الذيل من خلال توجيه خبراء متنوعين واعين للتوزيع
الملخص

تُوزَّع البيانات الطبيعية غالبًا بشكل طويل الذيل (long-tail) على فئات معنوية. تسعى الطرق الحالية للتعرف على هذه البيانات إلى معالجة التوزيع غير المتوازن من خلال إعطاء اهتمام أكبر للبيانات الواقعة في الذيل، وذلك عبر إعادة توازن الفئات أو إعادة وزنها، أو من خلال تجميع نماذج مختلفة مبنية على مجموعات بيانات مختلفة، مما يؤدي إلى تحسين دقة الفئات في الذيل ولكن بمقابل تراجع دقة الفئات في الرأس.ننظر إلى بيانات التدريب من منظور ديناميكي، ونقدّم تحليلًا منهجيًا للتحيّز (bias) والتباين (variance) في النموذج مع تغير بيانات التدريب: ففي الواقع، تزداد تباين النموذج بشكل لا مفر منه في النماذج الحالية المُصممة للفئات الطويلة الذيل، ويظل الفرق الكبير بين التحيّز في الرأس والذيل كبيرًا، وذلك بسبب التداخل الأكبر والأشد مع العناصر السلبية الصعبة (hard negatives) في الفئات الواقعة في الذيل.نُقدّم تصنيفًا جديدًا يُسمى "RoutIng Diverse Experts" (RIDE)، والذي يقلل من تباين النموذج بفضل استخدام خبراء متعددين، ويقلل من التحيّز من خلال دالة فقدان تراعي التوزيع (distribution-aware diversity loss)، كما يقلل من التكلفة الحسابية عبر وحدة توجيه خبراء ديناميكية. يتفوّق RIDE على أحدث النماذج في معايير التقييم، بما في ذلك CIFAR100-LT وImageNet-LT وiNaturalist 2018، بنسبة تتراوح بين 5% و7%. كما يُعد إطارًا عامًا قابلًا للتطبيق على مختلف الشبكات الأساسية (backbone networks)، وطرق التصنيف الطويلة الذيل، وآليات التدريب، لتحقيق تحسينات متسقة في الأداء. يمكن الوصول إلى الكود المصدري عبر الرابط التالي: https://github.com/frank-xwang/RIDE-LongTailRecognition.