HyperAIHyperAI
منذ 3 أشهر

التصنيف البصري الدقيق مع التحديد الفعّال من الطرف إلى الطرف

Harald Hanselmann, Hermann Ney
التصنيف البصري الدقيق مع التحديد الفعّال من الطرف إلى الطرف
الملخص

يُشير مصطلح التصنيف البصري الدقيق (FGVC) إلى مهام التصنيف التي تكون فيها الفئات متشابهة جدًا، وبالتالي يتطلب نموذج التصنيف القدرة على اكتشاف الفروقات الدقيقة لاتخاذ توقع صحيح. غالبًا ما تتضمن الطرق الحديثة الأكثر تقدمًا خطوة تحليل مكانيّة مصممة لمساعدة شبكة التصنيف من خلال تحديد الأجزاء ذات الصلة في الصور المدخلة. ومع ذلك، يتطلب ذلك عادةً عدة تكرارات أو ممرات عبر شبكة التصنيف الكاملة أو جداول تدريب معقدة. في هذا العمل، نقدّم وحدة تحليل مكانيّة فعّالة يمكن دمجها مع شبكة تصنيف ضمن هيكل متكامل من البداية إلى النهاية. من جهة، يتم تدريب الوحدة باستخدام التدرجات العائدة من شبكة التصنيف، ومن جهة أخرى، نُقدّم دالتين خاصتين بالتعلم الذاتي لتعزيز دقة التحليل المكاني. وقد قُمنا بتقييم النموذج الجديد على ثلاث مجموعات معيارية للبيانات: CUB200-2011 وStanford Cars وFGVC-Aircraft، وتمكّنا من تحقيق أداء تنافسي في التعرف.