HyperAIHyperAI
منذ 2 أشهر

التفصيل البانورامي الأمودي

Mohan, Rohit ; Valada, Abhinav
التفصيل البانورامي الأمودي
الملخص

لدى البشر القدرة المدهشة على إدراك الأشياء ككل، حتى عندما تكون أجزاء منها مخفية. تشكل هذه القدرة على الإدراك الأمودي أساس فهمنا الحسي والمعرفي للعالم من حولنا. لتمكين الروبوتات من التفكير بهذه القدرة، نصوغ ونقترح مهمة جديدة أطلقنا عليها اسم تقسيم البانوراما الأمودي (Amodal Panoptic Segmentation). هدف هذه المهمة هو التنبؤ بشكل متزامن بتصنيفات الشعاع الصوري لكل بكسل في المناطق المرئية من فئات المواد (Stuff Classes) وتصنيفات الحالات لكل بكسل في المناطق المرئية والمخفية من فئات الأشياء (Thing Classes).لتسهيل البحث في هذا المجال الجديد، قمنا بتوسيع مجموعتين معروفتين من بيانات الاختبار بمصنفات تقسيم البانوراما الأمودي على مستوى البكسل، والتي نجعلها متاحة للجمهور تحت اسم KITTI-360-APS و BDD100K-APS. نقدم عدة أسس قوية، بالإضافة إلى مقاييس جودة التقسيم البانورامي الأمودي (APQ) وتغطية تحليل الإدراك الأمودي (APC) لقياس الأداء بطريقة يمكن تفسيرها. علاوة على ذلك، نقترح شبكة تقسيم البانوراما الأمودي الجديدة (APSNet)، كخطوة أولى نحو التعامل مع هذه المهمة من خلال نمذجة العلاقات المعقدة بين المخفيات والمخفية.تظهر التقييمات التجريبية الواسعة أن APSNet يحقق أفضل الأداء في كلتا مجموعتي البيانات واهميته تكمن في توضيح فائدة الإدراك الأمودي. يمكن الوصول إلى مجموعات البيانات عبر الرابط: http://amodal-panoptic.cs.uni-freiburg.de.

التفصيل البانورامي الأمودي | أحدث الأوراق البحثية | HyperAI