HyperAIHyperAI
منذ 2 أشهر

4D-StOP: تقسيم البانورامي للليدار رباعي الأبعاد باستخدام توليد ودمج اقتراحات الكائنات المكانية-الزمانية

Kreuzberg, Lars ; Zulfikar, Idil Esen ; Mahadevan, Sabarinath ; Engelmann, Francis ; Leibe, Bastian
4D-StOP: تقسيم البانورامي للليدار رباعي الأبعاد باستخدام توليد ودمج اقتراحات الكائنات المكانية-الزمانية
الملخص

في هذا العمل، نقدم نموذجًا جديدًا يُسمى 4D-StOP لمعالجة مهمة تقسيم ليدار البانورامي رباعي الأبعاد (4D Panoptic LiDAR Segmentation). يقوم 4D-StOP أولاً بإنشاء اقتراحات زمانية-مكانية باستخدام توقعات المركز المستندة إلى التصويت، حيث يصوت كل نقطة في الحجم رباعي الأبعاد لمركز متوافق معها. يتم جمع هذه الاقتراحات المسارية بشكل أكبر باستخدام الخصائص الهندسية المُتعلمة. تُولد طريقة جمع المسارات هذه تمثيلًا مشهديًا على مستوى الفيديو رباعي الأبعاد عبر الحجم الزماني-المكاني بأكمله. وهذا يختلف عن النهج الرائدة الحالية التي يمكن تدريبها من البداية إلى النهاية والتي تستعمل تمثيلات زمانية-مكانية مُعبر عنها بتوزيعات احتمالية غاوسية (Gaussian probability distributions). يؤدي 方法我们的基于投票的轨迹生成方法,随后基于几何特征的聚合,与使用高斯概率分布建模整个四维体积相比,显著提高了全景激光雷达分割的质量。当应用于SemanticKITTI测试数据集时,4D-StOP实现了63.9 LSTQ的新纪录,比当前最佳的端到端可训练方法有大幅(+7%)提升。代码和预训练模型可在以下网址获取:https://github.com/LarsKreuzberg/4D-StOP。为了更好地符合阿拉伯语的表达习惯,我将对最后一句进行调整:طريقة إنشاء المسارات المستندة إلى التصويت لدينا، تليها جمع مستند إلى الخصائص الهندسية، تحقق نوعية تقسيم ليدار بانورامي أعلى بكثير عند مقارنتها بنمذجة الحجم رباعي الأبعاد بأكمله باستخدام توزيعات احتمالية غاوسية. عند تطبيق 4D-StOP على مجموعة بيانات اختبار SemanticKITTI، حقق نتائج جديدة رائدة بمعدل 63.9 LSTQ، وهو ما يمثل تحسنًا كبيرًا (+7%) مقارنة بالطرق القابلة للتدريب من البداية إلى النهاية والفعالة حاليًا. يمكن الحصول على الكود والنموذج المُدرب مسبقًا من الرابط التالي: https://github.com/LarsKreuzberg/4D-StOP.