HyperAIHyperAI
منذ 2 أشهر

DFANet: تجميع الميزات العميقة للفصل الدلالي في الوقت الفعلي

Hanchao Li; Pengfei Xiong; Haoqiang Fan; Jian Sun
DFANet: تجميع الميزات العميقة للفصل الدلالي في الوقت الفعلي
الملخص

يقدم هذا البحث معمارية CNN فائقة الكفاءة تُسمى DFANet للفصل الدلالي تحت قيود الموارد. الشبكة المقترحة تبدأ من هيكل خفيف الوزن واحد وتجمع الخصائص التمييزية من خلال التساقط الفرعي للشبكات والمرحلات على التوالي. بناءً على انتشار الخصائص متعددة الأحجام، يقلل DFANet بشكل كبير من عدد المعالم، ولكنه لا يزال يحصل على مجال استقبال كافٍ ويعزز قدرة نموذج التعلم، مما يحقق توازنًا بين السرعة وأداء الفصل. أظهرت التجارب على مجموعات البيانات Cityscapes و CamVid أن DFANet يتمتع بأداء أفضل بمقدار 8$\times$ أقل من العمليات العائمة النقطية (FLOPs) و2$\times$ أسرع من الطرق الحالية الأكثر تقدمًا للفصل الدلالي في الوقت الحقيقي مع دقة مقارنة. تحديدًا، حقق 70.3٪ من المتوسط IOU في مجموعة اختبار Cityscapes باستخدام فقط 1.7 جيجا فلوب (GFLOP) وبسرعة 160 إطارًا في الثانية (FPS) على بطاقة NVIDIA Titan X واحدة، و71.3٪ من المتوسط IOU باستخدام 3.4 جيجا فلوب (GFLOP) أثناء الاستدلال على صورة بدقة أعلى.