HyperAIHyperAI

Command Palette

Search for a command to run...

PETRv2: إطار موحد للاستشعار ثلاثي الأبعاد من صور متعددة الكاميرات

Yingfei Liu Junjie Yan Fan Jia Shuailin Li Aqi Gao Tiancai Wang* Xiangyu Zhang Jian Sun

الملخص

في هذا البحث، نقترح PETRv2، إطارًا موحدًا للاستشعار ثلاثي الأبعاد من صور متعددة الزوايا. استنادًا إلى PETR، يستكشف PETRv2 فعالية النمذجة الزمنية، والتي تستفيد من المعلومات الزمنية للصور السابقة لتعزيز اكتشاف الأجسام ثلاثية الأبعاد. بشكل أكثر تحديدًا، نوسع الترميز المكاني ثلاثي الأبعاد (3D PE) في PETR للنمذجة الزمنية. يحقق الترميز المكاني ثلاثي الأبعاد (3D PE) التوافق الزمني لموقع الجسم في الإطارات المختلفة. يتم تقديم مُشفِّر موقع موجه بالخصائص لتحسين قابلية تكيف 3D PE مع البيانات. لدعم التعلم متعدد المهام (مثل تقسيم المنظر الرأسي واكتشاف المسار ثلاثي الأبعاد)، يقدم PETRv2 حلًّا بسيطًا ومعتمدًا من خلال إدخال استعلامات خاصة بالمهمة، والتي يتم تهيئتها في فضاءات مختلفة. يحقق PETRv2 أداءً رائدًا في اكتشاف الأجسام ثلاثية الأبعاد، تقسيم المنظر الرأسي واكتشاف المسار ثلاثي الأبعاد. كما تم إجراء تحليل دقيق للثبات على إطار PETR. نأمل أن يكون PETRv2 نقطة بداية قوية للاستشعار ثلاثي الأبعاد. يمكن الحصول على الكود من \url{https://github.com/megvii-research/PETR}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp