HyperAIHyperAI
منذ 16 أيام

مُحَوِّل المُؤَشِّر المُميَّز للتحليل التصنيفي القليل التدريب

Jian-Wei Zhang, Yifan Sun, Yi Yang, Wei Chen
مُحَوِّل المُؤَشِّر المُميَّز للتحليل التصنيفي القليل التدريب
الملخص

يهدف التجزئة ذات العينات القليلة (FSS) إلى إجراء التجزئة الدلالية على فئات جديدة باستخدام عدد قليل من العينات الداعمة المُعلّمة. وبتحليل مجدد للتقدم الأخير، نلاحظ أن الإطار الحالي لـ FSS قد ابتعد كثيرًا عن إطار التجزئة المُراقب: فبينما تستخدم طرق FSS، عند توفر الميزات العميقة، مشغلًا معقدًا لتنفيذ تطابق دقيق على مستوى البكسل، تستخدم طرق التجزئة المُراقبة رأس تصنيف خطي بسيط. وبسبب التعقيد في بنية المشغل وخط أنابيب التطابق، يصعب اتباع هذا الإطار في FSS. تعيد هذه الورقة إحياء الإطار البسيط المتمثل في "مُستخرج الميزات + رأس تصنيف خطي"، وتقترح طريقة جديدة تُسمى "مُحول الميزات البوصلة" (FPTrans)، حيث يُمثل "البوصلة" المتجه الذي يمثل فئة دلالية في رأس التصنيف الخطي. تتميز FPTrans بمحورين رئيسيين في تعلم الميزات التمييزية والبوصلات التمثيلية: 1) لاستغلال أفضل للعينات الداعمة المحدودة، يُسمح لمُستخرج الميزات بجعل الاستعلام يتداخل مع ميزات الدعم من الطبقات السفلية إلى العلوية باستخدام استراتيجية تحفيزية جديدة. 2) تستخدم FPTrans عدة بوصلات خلفية محلية (بدلًا من بوصلة واحدة فقط) لأن الخلفية ليست متجانسة وربما تحتوي على مناطق أمامية جديدة. يمكن دمج هذين المحورين بسهولة في الهيكل الأساسي لمحول الرؤية (Vision Transformer) باستخدام آلية التحفيز في المحول. وباستخدام الميزات والبوصلات المُتعلّمة، تقوم FPTrans بمقارنة التشابه الجيبي مباشرة بينهما لإجراء التجزئة. وعلى الرغم من بساطة الإطار، نُظهر أن FPTrans تحقق دقة تنافسية في FSS توازي أداء أفضل الطرق القائمة على المشغل.

مُحَوِّل المُؤَشِّر المُميَّز للتحليل التصنيفي القليل التدريب | أحدث الأوراق البحثية | HyperAI