فهم الالتفاف للتقسيم الدلالي

التطورات الحديثة في التعلم العميق، خاصة شبكات العصبونات المتكررة العميقة (CNNs)، أدت إلى تحسين كبير على أنظمة الفصل الدلالي السابقة. في هذا البحث، نوضح كيفية تحسين الفصل الدلالي للبكسل من خلال تعديل العمليات المتعلقة بالتشويش التي لها قيمة نظرية وعملية. أولاً، صممنا تشويش التكثيف الكثيف (DUC) لإنتاج تنبؤ على مستوى البكسل، والذي يمكنه التقاط وتفسير معلومات أكثر تفصيلاً تكون عادةً غائبة في التشويش الثنائي الخطي. ثانيًا، اقترحنا إطار عمل تشويش المراوغة الهجين (HDC) في مرحلة الترميز. يوفر هذا الإطار 1) توسيع فعال لمجال الاستقبال (RF) للشبكة لجمع المعلومات العالمية؛ 2) تخفيف ما نسميه "مشكلة الشبكة" الناجمة عن عملية تشويش المراوغة القياسية. قمنا بتقييم نهجنا بشكل شامل على مجموعة بيانات Cityscapes، وحققنا نتيجة رائدة بلغت 80.1% من mIOU في مجموعة الاختبار عند وقت تقديم البحث. كما حققنا أفضل النتائج بشكل عام على معيار تقدير الطريق KITTI ومهمة الفصل PASCAL VOC2012. يمكن العثور على كود المصدر الخاص بنا على الرابط https://github.com/TuSimple/TuSimple-DUC .