Command Palette
Search for a command to run...
PETRv2: إطار موحد للاستشعار ثلاثي الأبعاد من صور متعددة الكاميرات
PETRv2: إطار موحد للاستشعار ثلاثي الأبعاد من صور متعددة الكاميرات
Yingfei Liu Junjie Yan Fan Jia Shuailin Li Aqi Gao Tiancai Wang* Xiangyu Zhang Jian Sun
الملخص
في هذا البحث، نقترح PETRv2، إطارًا موحدًا للاستشعار ثلاثي الأبعاد من صور متعددة الزوايا. استنادًا إلى PETR، يستكشف PETRv2 فعالية النمذجة الزمنية، والتي تستفيد من المعلومات الزمنية للصور السابقة لتعزيز اكتشاف الأجسام ثلاثية الأبعاد. بشكل أكثر تحديدًا، نوسع الترميز المكاني ثلاثي الأبعاد (3D PE) في PETR للنمذجة الزمنية. يحقق الترميز المكاني ثلاثي الأبعاد (3D PE) التوافق الزمني لموقع الجسم في الإطارات المختلفة. يتم تقديم مُشفِّر موقع موجه بالخصائص لتحسين قابلية تكيف 3D PE مع البيانات. لدعم التعلم متعدد المهام (مثل تقسيم المنظر الرأسي واكتشاف المسار ثلاثي الأبعاد)، يقدم PETRv2 حلًّا بسيطًا ومعتمدًا من خلال إدخال استعلامات خاصة بالمهمة، والتي يتم تهيئتها في فضاءات مختلفة. يحقق PETRv2 أداءً رائدًا في اكتشاف الأجسام ثلاثية الأبعاد، تقسيم المنظر الرأسي واكتشاف المسار ثلاثي الأبعاد. كما تم إجراء تحليل دقيق للثبات على إطار PETR. نأمل أن يكون PETRv2 نقطة بداية قوية للاستشعار ثلاثي الأبعاد. يمكن الحصول على الكود من \url{https://github.com/megvii-research/PETR}.