Command Palette
Search for a command to run...
التباين الهرمي الدلالي للتقسيم الدلالي المُراقب ضعيفًا
التباين الهرمي الدلالي للتقسيم الدلالي المُراقب ضعيفًا
Shaorong Xie Tong Liu Jide Li Songmin Dai Xiaoqiang Li Yuanchen Wu
الملخص
لقد حققت التجزئة الدلالية الضعيفة (WSSS) باستخدام التسميات على مستوى الصورة تقدماً كبيراً من خلال خريطة تفعيل الفئة (CAM). نظراً لأن خرائط CAM التقليدية تُعدّ غير فعّالة كمرشد لسد الفجوة بين التدريب الكامل والضعيف، اهتمت الدراسات الحديثة بتمثيلات دلالية لجعل CAM أكثر ملاءمة للتغلب على تحديات WSSS، وأظهرت نتائج واعدة. ومع ذلك، فإن هذه الدراسات تعتمد عموماً على تمثيلات دلالية على مستوى واحد فقط، مما قد يحد من قدرة النموذج على تعلّم هيكل دلالي شامل. مستلهمين من الفرضية القائلة بأن كل صورة تحتوي على مستويات متعددة من الدلالة، نقترح منهجية التناقض الدلالي الهرمي (HSC) لتحسين هذه المشكلة. تقوم HSC بإجراء تناقض دلالي من منظور خشن إلى دقيق، يشمل المستويات: منطقة الاهتمام (ROI)، والمستوى الفئوي، والمستوى البكسلية، مما يمكّن النموذج من فهم أعمق لأنماط الكائنات. ولتحسين جودة CAM بشكل أكبر، وبناءً على HSC، نستكشف منظوراً للانتظام المستمر عبر التدريب المتقاطع، ونطوّر تقنية تعلم النموذج المتأرجح (momentum prototype learning) لاستغلال التمثيلات الدلالية الغنية عبر الصور المختلفة. تُظهر الدراسات الواسعة أن نموذجنا القابل للتطبيق بسهولة، HSC، يمكنه رفع جودة CAM بشكل كبير على كل من النماذج التي لا تعتمد على التوجيه بالملحوظية (non-saliency-guided) والنموذج التي تعتمد عليه (saliency-guided)، كما يُسجّل أداءً قياسياً جديداً في مجال WSSS على مجموعة بيانات PASCAL VOC 2012.