HyperAIHyperAI

Command Palette

Search for a command to run...

Anchor3DLane: تعلم الانحدار لم kotف الممرات ثلاثية الأبعاد للكشف عن الممرات ثلاثية الأبعاد باستخدام الكاميرا أحادية العدسة

Shaofei Huang Zhenwei Shen Zehao Huang Zi-han Ding Jiao Dai Jizhong Han Naiyan Wang Si Liu

الملخص

كشف المسارات ثلاثية الأبعاد من خلال كاميرا واحدة هو مهمة صعبة بسبب نقص معلومات العمق. أحد الحلول الشائعة هو تحويل الصور أو الخصائص المرئية من الأمام (FV) إلى الفضاء المُشاهَد من أعلى (BEV) باستخدام التحويل المنظوري العكسي (IPM)، ومن ثم اكتشاف المسارات من خصائص BEV. ومع ذلك، فإن الاعتماد على فرضية الأرض المستوية في IPM وفقدان معلومات السياق يجعلها غير دقيقة في استعادة المعلومات ثلاثية الأبعاد من تمثيلات BEV. قد جُرِّبَت طريقة للتخلص من BEV والتنبؤ بالمسارات ثلاثية الأبعاد مباشرةً من تمثيلات FV، ولكنها لا تزال تتأخر عن الطرق المعتمدة على BEV بسبب نقص التمثيل الهيكلي للمسارات ثلاثية الأبعاد. في هذا البحث، نحدد نقاط مرجعية للمسارات ثلاثية الأبعاد في الفضاء ثلاثي الأبعاد ونقترح طريقة بدون BEV تسمى Anchor3DLane لتنبؤ المسارات ثلاثية الأبعاد مباشرةً من تمثيلات FV. يتم إسقاط نقاط مرجعية المسارات ثلاثية الأبعاد على خصائص FV لاستخراج خصائصها التي تحتوي على معلومات هيكلية وجيدة ومعلومات سياق لإجراء تنبؤات دقيقة. بالإضافة إلى ذلك، قمنا أيضًا بتطوير طريقة تحسين عالمي تستفيد من الخاصية المتساوية العرض بين المسارات لتقليل خطأ التنبؤ الجانبي. أظهرت التجارب الواسعة على ثلاثة مقاييس شهيرة لكشف المسارات ثلاثية الأبعاد أن Anchor3DLane يتفوق على الطرق السابقة المعتمدة على BEV ويحقق أفضل النتائج الحالية. الرمز البرمجي متاح على الرابط التالي:https://github.com/tusen-ai/Anchor3DLane.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp