HyperAIHyperAI
منذ 2 أشهر

استكشاف النماذج الزمنية المتمحورة حول الكائنات للكشف الفعال عن الأشياء ثلاثية الأبعاد من عدة زوايا مشاهدة

Wang, Shihao ; Liu, Yingfei ; Wang, Tiancai ; Li, Ying ; Zhang, Xiangyu
استكشاف النماذج الزمنية المتمحورة حول الكائنات للكشف الفعال عن الأشياء ثلاثية الأبعاد من عدة زوايا مشاهدة
الملخص

في هذا البحث، نقترح إطارًا لنمذجة التسلسلات الطويلة، يُسمى StreamPETR، للكشف عن الأشياء ثلاثية الأبعاد من وجهات نظر متعددة. بناءً على تصميم الاستعلامات النادرة في سلسلة PETR، نطور بشكل منهجي آلية زمنية متمحورة حول الكائنات. يتم تنفيذ النموذج بطريقة مباشرة (online)، ويتم نقل المعلومات التاريخية طويلة المدى عبر الاستعلامات الإطار تلو الإطار. بالإضافة إلى ذلك، نقدم تطبيعًا طبقيًا واعٍ للحركة لنمذجة حركة الأشياء. يحقق StreamPETR تحسينات أداء كبيرة مع زيادة بسيطة جدًا في التكلفة الحسابية مقارنة بالنموذج الأساسي ذو الإطار الواحد. على مقاييس nuScenes القياسية، يعد StreamPETR أول طريقة مباشرة متعددة الوجهات النظر تحقق أداءً مكافئًا (67.6% NDS و 65.3% AMOTA) مع الطرق القائمة على الليدار (lidar). يحقق الإصدار الخفيف 45.0% mAP و 31.7 FPS، مما يتفوق على أفضل الطرق الحالية (SOLOFusion) بنسبة 2.3% mAP وأسرع بمقدار 1.8 مرة في FPS. يمكن الحصول على الرمز المصدر من https://github.com/exiawsh/StreamPETR.git.

استكشاف النماذج الزمنية المتمحورة حول الكائنات للكشف الفعال عن الأشياء ثلاثية الأبعاد من عدة زوايا مشاهدة | أحدث الأوراق البحثية | HyperAI