الاستخلاص الترابطي الكثيف الهرمي للتقسيم القائم على عدد قليل من الأمثلة

يهدف التجزئة المعنى القليلة الأمثل (FSS) إلى إنشاء نماذج غير مُحددة بالفئة، بحيث تقوم بتمييز فئات غير مرئية باستخدام عدد قليل جدًا من التسميات. تعاني الطرق السابقة، التي تقتصر على السمات المعنى والتمثيل النموذجي، من تفاصيل تجزئة خشنة وتعرض مفرط للانحياز في مجموعة التدريب. في هذه الدراسة، نصمم شبكة مطابقة منفصلة هرمية (HDMNet) تقوم باستخلاص ارتباطات الدعم على مستوى البكسل باستخدام بنية المحول (Transformer). تُستخدم وحدات الانتباه الذاتي لمساعدة إنشاء سمات كثيفة هرمية، بهدف تحقيق عملية مطابقة متسلسلة بين السمات المستجيبة والسمات الداعمة. علاوة على ذلك، نقترح وحدة مطابقة لتقليل التعرض للانحياز في مجموعة التدريب، ونُدخل تقطيع الارتباطات المستند إلى التوافق المعنى من دقة منخفضة إلى دقة عالية، بهدف تعزيز التجزئة الدقيقة. تُظهر طريقتنا أداءً جيدًا في التجارب، حيث نحقق متوسط دقة تقاطع على المجموعة (mIoU) قدره 50.0% في بيئة التجزئة ذات المثال الواحد على مجموعة بيانات \coco، و56.0% في بيئة التجزئة الخمسية.