HyperAIHyperAI
منذ 7 أيام

EfficientPS: التجزئة الشاملة الفعالة

Rohit Mohan, Abhinav Valada
EfficientPS: التجزئة الشاملة الفعالة
الملخص

فهم المشهد الذي يعمل فيه روبوت ذاتي القيادة أمر بالغ الأهمية لضمان أداؤه الفعّال. ويُعدّ فهم هذا المشهد مطلوبًا لتحديد هوية المشاركين في حركة المرور، بالإضافة إلى فهم المعاني العامة للمشهد، وهو ما يمكن معالجته بشكل فعّال من خلال مهمة التجزئة البانوبتيكية. في هذه الورقة، نقدّم معمارية التجزئة البانوبتيكية الفعّالة (EfficientPS)، التي تتكون من هيكل أساسي مشترك يقوم بترميز ودمج ميزات متعددة المقياس غنية من الناحية الدلالية بشكل فعّال. كما ندمج رأسًا دلاليًا جديدًا يجمع الميزات الدقيقة والمواضعية بشكل متماسك، ونقدّم نسخة جديدة من نموذج Mask R-CNN كرأس لتحديد الهوية. ونُقدّم أيضًا وحدة دمج بانوبتيكية جديدة تُدمج بشكل متناسق مخرجات الاحتمالات الناتجة من كلا الرأسين في معمارية EfficientPS لتوليد الناتج النهائي للتجزئة البانوبتيكية. بالإضافة إلى ذلك، نُقدّم مجموعة بيانات التجزئة البانوبتيكية الخاصة بـ KITTI، التي تحتوي على تسميات بانوبتيكية للمشهد في معيار KITTI الشهير والصعب. وتشير التقييمات الواسعة على مجموعات بيانات Cityscapes وKITTI وMapillary Vistas وIndian Driving Dataset إلى أن المعمارية المقترحة تُحقّق حالة جديدة من التقدّم في جميع هذه المعايير الأربعة، مع أنّها الأسرع والأكثر كفاءة في التجزئة البانوبتيكية حتى تاريخه.

EfficientPS: التجزئة الشاملة الفعالة | أحدث الأوراق البحثية | HyperAI