ExFuse: تحسين دمج الميزات للتمييز الدلالي

تقوم الإطارات الحديثة للتقطيع الدلالي عادةً بدمج الخصائص من المستوى المنخفض والمستوى العالي من النماذج التلافيفية المدربة مسبقًا لتعزيز الأداء. في هذا البحث، نشير أولاً إلى أن دمجًا بسيطًا للخصائص من المستوى المنخفض والمستوى العالي قد يكون أقل فعالية بسبب الفجوة في المستويات الدلالية والدقة المكانية. وجدنا أن إدخال المعلومات الدلالية إلى الخصائص من المستوى المنخفض وإدخال التفاصيل ذات الدقة العالية إلى الخصائص من المستوى العالي هو أكثر فعالية للدمج اللاحق. بناءً على هذه الملاحظة، نقترح إطارًا جديدًا يُسمى ExFuse، لسد الفجوة بين الخصائص من المستوى المنخفض والمستوى العالي، مما يؤدي إلى تحسين كبير في جودة التقطيع بمقدار 4.0٪ بشكل عام. بالإضافة إلى ذلك، قمنا بتقييم نهجنا على معيار التقطيع الصعب PASCAL VOC 2012 وحققنا نسبة تقاطع متوسطة (mean IoU) بلغت 87.9٪، والتي تتفوق على أفضل النتائج السابقة في هذا المجال.