HyperAIHyperAI
منذ 17 أيام

ELoPE: التصنيف البصري الدقيق مع التحديد الفعّال والتجميع والتمثيل

Harald Hanselmann, Hermann Ney
ELoPE: التصنيف البصري الدقيق مع التحديد الفعّال والتجميع والتمثيل
الملخص

تتناول مهمة التصنيف البصري الدقيق (FGVC) مشكلات التصنيف التي تتميز بتمايز داخلي صغير بين الفئات، مثل التمييز بين أنواع الطيور المختلفة أو نماذج السيارات. تسعى الطرق المتطورة عادةً إلى معالجة هذه المشكلة من خلال دمج آلية انتباه معقدة أو طريقة لتحديد المواقع (أو أجزاء) داخل شبكة عصبية متعددة الطبقات (CNN) قياسية. وفي هذا العمل، يهدف إلى تحسين أداء شبكة CNN الأساسية مثل ResNet من خلال دمج ثلاثة مكونات فعالة وخفيفة الوزن مصممة خصيصًا لمهام FGVC. يتم ذلك باستخدام تقنية التجميع العالمي k-أقصى (global k-max pooling)، وطبقة تضمين تمييزية تم تدريبها من خلال تحسين المتوسطات الفئوية، بالإضافة إلى مُقدّر مربع حدودي فعّال يحتاج فقط إلى تسميات الفئات لتدريبه. ويحقق النموذج الناتج أفضل دقة في التعرف على الإطلاق على مجموعتي بيانات Stanford Cars وFGVC-Aircraft.

ELoPE: التصنيف البصري الدقيق مع التحديد الفعّال والتجميع والتمثيل | أحدث الأوراق البحثية | HyperAI