أجزاء محددة حسب التصنيف لتحسين التصنيف البصري الدقيق

التصنيف البصري الدقيق هو مهمة تصنيف تهدف إلى التمييز بين فئات تتميز بتمايز داخلي عالٍ وتمايز بيني ضئيل. في حين تسعى النماذج الشاملة إلى استخدام الصورة بالكامل لأداء التصنيف، تجمع الحلول القائمة على الأجزاء معلومات محلية إضافية من خلال الانتباه أو تحديد الأجزاء. نقترح طريقة جديدة لتقدير الأجزاء المخصصة للتصنيف، تستخدم التنبؤ الأولي بالإضافة إلى تغذية راجعة لأساليب أهمية الميزات من خلال حسابات التدرج (التفاضل) لتقدير مناطق الصورة ذات الصلة. ثم يتم اختيار الأجزاء المكتشفة لاحقًا ليس فقط بناءً على معرفة تصنيف ما بعد الاحتمال، بل أيضًا بامتلاكها مقياسًا مكانيًا داخليًا يتم تحديده تلقائيًا. ويختلف هذا عن معظم النماذج القائمة على الأجزاء، بل وحتى عن التسميات الحقيقية المتوفرة للأجزاء، التي تقدم فقط إحداثيات نقطة دون أي معلومات إضافية حول الحجم أو المقياس. ونُظهر في تجاربنا على مجموعة متنوعة من مجموعات البيانات الدقيقة الشائعة الفعالية للطريقة المذكورة في اختيار الأجزاء بالاقتران مع الميزات المستخلصة من تلك الأجزاء.