شبكة التفكيك للتقسيم الدلالي

نقترح خوارزمية جديدة للتقسيم الدلالي من خلال تعلم شبكة التفكيك (deconvolution) المعمقة. نتعلم هذه الشبكة فوق طبقات التجميع (convolutional) المستخدمة من شبكة VGG ذات الـ 16 طبقة. تتكون شبكة التفكيك من طبقات التفكيك والتفكيك العكسي (unpooling)، والتي تقوم بتحديد تصنيفات البكسل وتنبؤ الأقنعة التقسيمية. نطبق الشبكة المدربة على كل اقتراح في الصورة الإدخال، ونبني الخريطة النهائية للتقسيم الدلالي بدمج النتائج من جميع الاقتراحات بطريقة بسيطة. تخفف الخوارزمية المقترحة من حدود الطرق الحالية التي تعتمد على الشبكات التجميعية الكاملة عن طريق دمج شبكة التفكيك العميقة والتنبؤ حسب الاقتراح؛ عادةً ما يحدد طريقة تقسيمنا الهياكل التفصيلية ويتعامل مع الأشياء في مقاييس متعددة بشكل طبيعي. أظهرت شبكتنا أداءً متميزًا في مجموعة بيانات PASCAL VOC 2012، وحققنا أفضل دقة (72.5%) بين الطرق التي تم تدريبها بدون بيانات خارجية من خلال الجمع مع الشبكة التجميعية الكاملة.