شبكة ترابط فائق تعتمد على التشابه المتعدد للتحليل التصنيفي القائم على عدد قليل من الأمثلة

يهدف التجزئة الشاملة القليلة الأمثل إلى تحديد مناطق الكائنات لفئات غير مرئية باستخدام عدد قليل جدًا من الأمثلة المُعلَّمة كمُراقبة. ويعتمد الحل الأساسي للتجميع الشامل القليل الأمثل على إقامة علاقة شمولية قوية بين الصور الداعمة (support) والصور الاستقصائية (query)، مع منع التعلم الزائد (overfitting). في هذه الورقة، نقترح شبكة متعددة التشابه والهيراركية الفعالة (MSHNet) لمعالجة مشكلة التجزئة الشاملة القليلة الأمثل. في MSHNet، نُقدِّم مفهومًا جديدًا يُسمَّى "تشابه البروتوكول التوليدي" (GPS)، والذي يُستخدم مع تشابه الجيب (cosine similarity) لبناء علاقة شمولية قوية بين الصور الداعمة والاستقصائية. ويُعد تشابه البروتوكول المُولَّد محليًا بناءً على السمات العالمية مكملًا منطقيًا لتشابه الجيب القائم على السمات المحلية، ويمكن التعبير عن العلاقة بين الصورة الاستقصائية والصورة الداعمة بشكل أكثر شمولاً من خلال استخدام كلا التشابهين معًا. بالإضافة إلى ذلك، نُقدِّم في MSHNet كتلة دمج متماثلة (SMB) لدمج السمات الهيراركية متعددة الطبقات والمتعددة الأمثلة والمتعددة التشابهات بكفاءة. تعتمد MSHNet على التشابه بدلًا من ميزات الفئة المحددة، مما يتيح وحدة عامة أكثر ويعمل على تقليل التعلم الزائد بشكل فعّال. وقد حققت MSHNet أداءً جديدًا على مستوى الحد الأقصى (state-of-the-art) في مهام التجزئة الشاملة القليلة الأمثل (1-shot و 5-shot) على مجموعتي بيانات معيارين هما Pascal-5i و COCO-20i.