HyperAIHyperAI
منذ 12 أيام

التشفير المقنع للصورة المتقاطعة للتحليل القائم على عدد قليل من الأمثلة

Wenbo Xu, Huaxi Huang, Ming Cheng, Litao Yu, Qiang Wu, Jian Zhang
التشفير المقنع للصورة المتقاطعة للتحليل القائم على عدد قليل من الأمثلة
الملخص

التحليل القائم على عدد قليل من الأمثلة (Few-shot segmentation - FSS) هو مهمة تنبؤ كثيفة تهدف إلى استنتاج التسميات على مستوى البكسل للتصنيفات غير المرئية باستخدام عدد محدود من الصور المُعلَّمة. ويتمثل التحدي الرئيسي في FSS في تصنيف تسميات بكسل الاستعلام باستخدام نماذج فئوية تم تعلمها من أمثلة داعمة مُعلَّمة بقليل من الصور. وقد ركّزت الطرق السابقة على FSS عادةً على تعلُّم وصفات مميزة لكل فئة بشكل مستقل من صور الدعم، مما يؤدي إلى إهمال المعلومات السياقية الغنية والاعتماديات المتبادلة بين ميزات الصور الداعمة والصورة المسترجعة. وللتغلب على هذا التقييد، نقترح طريقة تعلُّم مشترك تُسمى ترميز الصورة المُغَطَّاة المتقاطعة (Masked Cross-Image Encoding - MCE)، المصممة لاستكشاف الخصائص البصرية المشتركة التي تصف تفاصيل الكائنات، وتعلُّم الاعتماديات المتبادلة ثنائية الاتجاه بين الصور لتعزيز التفاعل بين الميزات. ولا تقتصر MCE على كونها مجرد وحدة لتعزيز التمثيل البصري، بل تأخذ بعين الاعتبار أيضًا الاعتماديات المتبادلة بين الصور والتوجيه الضمني. وقد أظهرت التجارب على معايير FSS PASCAL-$5^i$ وCOCO-$20^i$ القدرة المتقدمة للطريقة المقترحة على التعلُّم التلوي (meta-learning).

التشفير المقنع للصورة المتقاطعة للتحليل القائم على عدد قليل من الأمثلة | أحدث الأوراق البحثية | HyperAI