HyperAIHyperAI
منذ 9 أيام

التقديم المُعزَّز بالاسترجاع للتصنيف في التعرف البصري على الأطوار الطويلة

Alexander Long, Wei Yin, Thalaiyasingam Ajanthan, Vu Nguyen, Pulak Purkait, Ravi Garg, Alan Blair, Chunhua Shen, Anton van den Hengel
التقديم المُعزَّز بالاسترجاع للتصنيف في التعرف البصري على الأطوار الطويلة
الملخص

نقدّم نموذج التصنيف المدعوم بالاسترجاع (RAC)، وهو منهج عام لتعزيز خطوط أنابيب التصنيف الصوري القياسية من خلال إدراج وحدة استرجاع صريحة. يتكوّن RAC من مشغل صوري أساسي قياسي مدمج مع فرع موازٍ للاسترجاع، يُجري استفسارات في ذاكرة خارجية غير مُعامَلة (non-parametric) مكوّنة من صور مُشفّرة مسبقًا ونصوص مُرتبطة بها. ونطبّق RAC على مشكلة التصنيف الطويل الذيل (long-tail classification)، ونُظهر تحسّنًا ملحوظًا مقارنةً بأفضل النماذج السابقة على مجموعتي بيانات Places365-LT وiNaturalist-2018 (بما يُعادل 14.5% و6.7% على التوالي)، رغم استخدامنا فقط لمجموعات التدريب نفسها كمصدر للمعلومات الخارجية. ونُظهر أن وحدة الاسترجاع في RAC، دون الحاجة إلى توجيه (prompting)، تتعلم مستوى عالٍ من الدقة في فئات الذيل الطويلة. وهذا بدوره يُحرّر المشغل الأساسي ليتمركز على الفئات الشائعة، ويُحسّن أداؤه فيها. يُشكّل RAC منهجًا بديلًا لاستخدام النماذج الكبيرة المُدرّبة مسبقًا دون الحاجة إلى التخصيص (fine-tuning)، كما يُمثّل خطوة أولى نحو الاستفادة بشكل أكثر فعالية من الذاكرة الخارجية داخل الهياكل الشائعة في مجال الرؤية الحاسوبية.

التقديم المُعزَّز بالاسترجاع للتصنيف في التعرف البصري على الأطوار الطويلة | أحدث الأوراق البحثية | HyperAI