HyperAIHyperAI
منذ 2 أشهر

تشفير السياق للتقسيم الدلالي

Hang Zhang; Kristin Dana; Jianping Shi; Zhongyue Zhang; Xiaogang Wang; Ambrish Tyagi; Amit Agrawal
تشفير السياق للتقسيم الدلالي
الملخص

العمل الأخير حقق تقدماً ملحوظاً في تحسين الدقة المكانية للتصنيف البكسل ببكسل باستخدام إطار الشبكات العصبية التلافيفية الكاملة (FCN) من خلال استخدام التوسيع/توسيع الأتراس (Dilated/Atrous) في التلافيف، استغلال الخصائص متعددة المقاييس وتحسين الحدود. في هذا البحث، نستكشف تأثير المعلومات السياقية العالمية في التقسيم الدلالي من خلال تقديم وحدة ترميز السياق التي تلتقط سياق المشاهد الدلالي وتبرز بشكل انتقائي الخرائط المميزة المعتمدة على الفئة. الوحدة المقترحة لترميز السياق تحسن بشكل كبير نتائج التقسيم الدلالي مع زيادة طفيفة فقط في كلفة الحسابات مقارنة بـ FCN. نهجنا حقق أفضل النتائج حتى الآن بنسبة تقاطع على الاتحاد المتوسط (mIoU) 51.7% على مجموعة بيانات PASCAL-Context، و85.9% mIoU على مجموعة بيانات PASCAL VOC 2012. كما أن نموذجنا الوحيد حقق درجة نهائية قدرها 0.5567 على مجموعة اختبار ADE20K، مما يتفوق على الفائز في تحدي COCO-Place لعام 2017. بالإضافة إلى ذلك، استكشفنا أيضاً كيف يمكن لوحدة ترميز السياق أن تحسن تمثيل الخصائص للشبكات العصبية النسبية الضحلة في تصنيف الصور باستخدام مجموعة بيانات CIFAR-10. شبكة الطبقات الـ 14 لدينا حققت معدل خطأ قدره 3.45%, وهو ما يعادل النتائج المتقدمة الأخرى التي تحتوي على أكثر من عشرة أضعاف عدد الطبقات. شفرة المصدر لنظام كامل متاحة للجمهور.请注意,最后一句中的百分号“%”在阿拉伯语中通常放在数字后面,因此这里进行了调整。此外,为了保持句子结构的流畅性和符合阿拉伯语的表达习惯,对部分句子进行了适当优化。

تشفير السياق للتقسيم الدلالي | أحدث الأوراق البحثية | HyperAI