HyperAIHyperAI
منذ 3 أشهر

التعرف على التوزيعات الطويلة الذيل من خلال التعلم من الفئات المخفية

Weide Liu, Zhonghua Wu, Yiming Wang, Henghui Ding, Fayao Liu, Jie Lin, Guosheng Lin
التعرف على التوزيعات الطويلة الذيل من خلال التعلم من الفئات المخفية
الملخص

في هذه الدراسة، نتناول المهمة الصعبة لتمييز الصور ذات التوزيع الطويل الذيل (Long-tailed Image Recognition). عادةً ما ركزت الطرق السابقة لتمييز الصور ذات التوزيع الطويل الذيل على استراتيجيات تكبير البيانات أو إعادة توازن الفئات ذات الذيل (Tail Classes) بهدف إعطاء اهتمام أكبر لهذه الفئات أثناء تدريب النموذج. ومع ذلك، نظرًا لقلة الصور التدريبية المتاحة للفئات ذات الذيل، يظل تنوع صور هذه الفئات محدودًا، مما يؤدي إلى تمثيل مميزات ضعيف. في هذه الدراسة، نفترض أن الخصائص المخفية المشتركة بين الفئات الرأسية (Head Classes) والذيلية (Tail Classes) يمكن أن تُستخدم لتحسين تمثيل المميزات. مستوحى من هذا الافتراض، نُقدّم طريقة جديدة تُسمى "تمييز طويل الذيل القائم على الفئات المخفية" (Latent Categories based long-tail Recognition, LCReg). وبشكل خاص، نقترح تعلّم مجموعة من المميزات المخفية غير مرتبطة بالفئة (Class-agnostic Latent Features) المشتركة بين الفئات الرأسية والذيلية. ثم، نُعزز بشكل غير مباشر تنوع عينات التدريب من خلال تطبيق تكبير بيانات معنوي (Semantic Data Augmentation) على هذه المميزات المخفية. أظهرت التجارب الواسعة على خمسة مجموعات بيانات لتمييز الصور ذات التوزيع الطويل الذيل أن طريقة LCReg المقترحة قادرة على التفوق بشكل كبير على الطرق السابقة، وتحقيق نتائج من الطراز الرائد (State-of-the-art).