HyperAIHyperAI
منذ 2 أشهر

BiSeNet: شبكة التقطيع الثنائية للفصل الدلالي في الوقت الحقيقي

Yu, Changqian ; Wang, Jingbo ; Peng, Chao ; Gao, Changxin ; Yu, Gang ; Sang, Nong
BiSeNet: شبكة التقطيع الثنائية للفصل الدلالي في الوقت الحقيقي
الملخص

التفصيل الدلالي يتطلب كلًا من المعلومات المكانية الغنية ومجال استقبال كبير. ومع ذلك، فإن النهج الحديثة غالبًا ما تضحي بدقة التحليل المكاني لتحقيق سرعة الاستدلال الفوري، مما يؤدي إلى أداء ضعيف. في هذا البحث، نعالج هذه الإشكالية من خلال شبكة التفصيل الثنائية (BiSeNet) الجديدة. أولاً، نصمم مسارًا مكانيًا بخطوة صغيرة للحفاظ على المعلومات المكانية وإنتاج خصائص ذات دقة عالية. وفي الوقت نفسه، يتم استخدام مسار السياق مع استراتيجية تقليل الحجم بسرعة للحصول على مجال استقبال كافٍ. فوق المسارين، نقدم وحدة دمج الخصائص الجديدة لدمج الخصائص بكفاءة. يحقق التصميم المقترح توازنًا صحيحًا بين السرعة وأداء التفصيل على مجموعات البيانات Cityscapes و CamVid و COCO-Stuff. بشكل خاص، بالنسبة للمدخلات بحجم 2048x1024، نحقق نسبة تقاطع على الاتحاد (Mean IOU) قدرها 68.4% على مجموعة اختبار Cityscapes بمعدل سرعة 105 إطار في الثانية على بطاقة NVIDIA Titan XP واحدة، وهو أسرع بكثير من الطرق الموجودة التي تحقق أداءً مشابهًا.

BiSeNet: شبكة التقطيع الثنائية للفصل الدلالي في الوقت الحقيقي | أحدث الأوراق البحثية | HyperAI