Command Palette
Search for a command to run...
هل هذه الطيور متشابهة: تعلم الشبكات الفرعية لتمثيلات دقيقة
هل هذه الطيور متشابهة: تعلم الشبكات الفرعية لتمثيلات دقيقة
Ignazio Gallo Nicola Landro Moreno Caraffini Alessandro Calefati Shah Nawaz
الملخص
التصنيف الدقيق للصور هو مهمة صعبة نظرًا لوجود توزيع هرمي من النوع الخشن إلى الدقيق في مجموعة البيانات. عادةً ما تُستخدم الأجزاء لتمييز الكائنات المختلفة في مجموعات البيانات الدقيقة، لكن ليس كل جزء مفيدًا أو ضروريًا. في السنوات الأخيرة، تم استخدام الوصف باللغة الطبيعية للحصول على معلومات حول الأجزاء التمييزية للكائن. تُركّز هذه الورقة على استخدام الوصف باللغة الطبيعية وتقترح استراتيجية لتعلم التمثيل المشترك بين الوصف باللغة الطبيعية والصور باستخدام شبكة ذات فرعين ومتعددة الطبقات، بهدف تحسين مهمة التصنيف الدقيق للصور. أظهرت التجارب الواسعة أن منهجنا يحقق تحسينات كبيرة في الدقة لمهام التصنيف الدقيق للصور. علاوةً على ذلك، حقق منهجنا نتائج جديدة في مستوى الحالة الحالية (state-of-the-art) على مجموعة بيانات CUB-200-2011.