Mask4D: التجزئة الشاملة الأربعة الأبعاد القائمة على القناع وذات النهاية إلى النهاية لسلسلة LiDAR

يُعد فهم المشهد أمرًا بالغ الأهمية للأنظمة المستقلة لضمان التنقل الموثوق في العالم الحقيقي. يتيح تقسيم البانوبتيك للمسح ثلاثي الأبعاد باستخدام ليدار التوصيف الشمولي للبيئة المحيطة بالمركبة من خلال التنبؤ بفئات معنوية لكل نقطة ثلاثية الأبعاد وتحديد الهويات الفردية من خلال أرقام هوية منفصلة. ولوصف ديناميكيات البيئة المحيطة، يوسع التقسيم البانوبتيك الأربعة الأبعاد هذه المعلومات بدمج أرقام هوية متسقة زمنيًا لتحديد الهويات المختلفة في المسح بشكل متسق عبر التسلسل الكامل. تعتمد الطرق السابقة لتقسيم البانوبتيك الأربعة الأبعاد على خطوات ما بعد المعالجة، وغالبًا ما تكون غير قابلة للتدريب من النهاية إلى النهاية. في هذه الورقة، نقترح منهجية جديدة يمكن تدريبها من النهاية إلى النهاية، وتنبئ مباشرة بمجموعة من الأقنعة غير المتداخلة مع فئاتها المعنوية وأرقام هوياتها الفردية، والتي تبقى متسقة عبر الزمن دون الحاجة إلى أي معالجة ما بعدية مثل التجميع أو الربط بين التنبؤات. نوسع نموذج تقسيم البانوبتيك ثلاثي الأبعاد القائم على الأقنعة إلى أربعة أبعاد من خلال إعادة استخدام الاستعلامات التي فككَت الهويات في المسح السابق. وبهذه الطريقة، تُفكك كل استعلام نفس الهوية عبر الزمن، وتحتفظ برمز هويتها، ويتم التتبع بشكل ضمني. وهذا يمكّننا من تحسين التقسيم والتعقب معًا، ويسمح بفرض إشراف مباشر على تقسيم البانوبتيك الأربعة الأبعاد.