HyperAIHyperAI
منذ 16 أيام

التوجيه متعدد السياقات القائم على الانتباه للتحليل الدلالي القائم على أمثلة قليلة

{Gang Yu, Pengwan Yang, Tao Hu, Chiliang Zhang, Yadong Mu, Cees G. M. Snoek}
الملخص

التعلم القليل النماذج (Few-shot learning) هو موضوع بحثي ناشئ، يُحفَّز بحقيقة أن الطرق التقليدية للتعلم العميق تتطلب كميات هائلة من البيانات. وتزداد صعوبة نقص البيانات المُعلَّمة بشكل خاص في مهمة التجزئة الدلالية (semantic segmentation)، نظرًا لطبيعة التصنيف على مستوى البكسل التي تتطلب جهدًا يدويًا كبيرًا في الحصول عليها. لمعالجة هذه المشكلة، نقترح شبكة A-MCG (Attention-based Multi-Context Guiding)، التي تتكون من ثلاثة فروع: الفرع الداعم (support branch)، والفَرع الاستقصائي (query branch)، وفَرع دمج الميزات (feature fusion branch). يتميز A-MCG بشكل رئيسي بدمج ميزات السياق متعددة المقاييس بين الفرعين الداعم والاستقصائي، مما يعزز التوجيه بشكل أفضل من مجموعة الدعم. بالإضافة إلى ذلك، نستخدم انتباهًا فضائيًا (spatial attention) على طول فرع الدمج لتسليط الضوء على معلومات السياق من مقاييس متعددة، مما يعزز التعلم ذاتيًا (self-supervision) في سيناريوهات التعلم بعينة واحدة (one-shot learning). ولحل مشكلة الدمج في سيناريوهات التعلم متعددة النماذج (multi-shot learning)، نعتمد على Conv-LSTM لدمج التمثيلات التسلسلية للبيانات الداعمة بشكل تعاوني، مما يرفع من دقة الناتج النهائي. تحقق البنية المقترحة أداءً متميزًا على الفئات غير المرئية في مجموعة بيانات PASCAL VOC12 المختلفة، وتتفوّق على الطرق السابقة بزيادة ملحوظة قدرها 1.1% و1.4% قياسًا بمؤشر mIoU في سيناريوهات التعلم بعينة واحدة (1-shot) وخمس عينات (5-shot) على التوالي.

التوجيه متعدد السياقات القائم على الانتباه للتحليل الدلالي القائم على أمثلة قليلة | أحدث الأوراق البحثية | HyperAI