HyperAIHyperAI

Command Palette

Search for a command to run...

DSGN++: استغلال العلاقة البصرية-المكانية للكاشفات ثلاثية الأبعاد المستندة إلى الصور النمطية

Yilun Chen, Student Member, IEEE, Shijia Huang, Student Member, IEEE, Shu Liu, Member, IEEE, Bei Yu, Member, IEEE, Jiaya Jia, Fellow, IEEE

الملخص

مرحبًا بالمستشعرات ثلاثية الأبعاد القائمة على الكاميرا نظرًا لانتشارها الأوسع وسعرها الأقل مقارنة بمستشعرات ليدار (LiDAR). أولاً، نعيد النظر في المستشعر الاستريو السابق DSGN لمعرفة طرق بناء الحجم الاستريو التي تمثل الهندسة الثلاثية الأبعاد والدلالات. نحسن النمذجة الاستريو ونقترح الإصدار المتطور DSGN++ بهدف تعزيز تدفق المعلومات الفعّال عبر خط الأنابيب من二维到三维 in ثلاثة جوانب رئيسية. أولاً، لرفع المعلومات ثنائية الأبعاد إلى الحجم الاستريو بشكل فعال، نقترح تقنية المسح الطائفي العمقي (DPS) التي تسمح بروابط أكثر كثافة واستخراج خصائص موجهة بالعمق. ثانيًا، للإمساك بالخصائص ذات المسافات المختلفة، نقدم حجم استريو جديد -- الحجم الاستريو ثنائي المنظور (DSV) الذي يدمج الخصائص الأمامية والعلوية ويقوم بإعادة بناء العمق الفرعي-البكسيلي في هرم الكاميرا. ثالثًا، مع انخفاض هيمنة المنطقة الأولى في الفضاء الثلاثي الأبعاد، نقترح استراتيجية تحرير البيانات متعددة الوسائط -- Stereo-LiDAR Copy-Paste، والتي تضمن التوافق بين الوسائط وتزيد من كفاءة البيانات. بدون أي تعقيدات زائدة، تظهر التجارب الواسعة في مجموعة متنوعة من الإعدادات الوسيطة على مقاييس KITTI الشهيرة أن طريقتنا تتفوق باستمرار على المستشعرات ثلاثية الأبعاد الأخرى القائمة على الكاميرا في جميع الفئات. يمكن الحصول على الرمز البرمجي من https://github.com/chenyilun95/DSGN2.注:在阿拉伯语中,“从二维到三维”可以翻译为“من ثنائية الأبعاد إلى ثلاثية الأبعاد”。为了保持句子的连贯性和流畅度,我在翻译时将其融入了上下文中。以下是修正后的版本:مرحبًا بالمستشعرات ثلاثية الأبعاد القائمة على الكاميرا نظرًا لانتشارها الأوسع وسعرها الأقل مقارنة بمستشعرات ليدار (LiDAR). أولاً، نعيد النظر في المستشعر الاستريو السابق DSGN لمعرفة طرق بناء الحجم الاستريو التي تمثل الهندسة الثلاثية الأبعاد والدلالات. نحسن النمذجة الاستريو ونقترح الإصدار المتطور DSGN++ بهدف تعزيز تدفق المعلومات الفعّال عبر خط الأنابيب من ثنائية الأبعاد إلى ثلاثية الأبعاد في ثلاثة جوانب رئيسية. أولاً، لرفع المعلومات ثنائية الأبعاد إلى الحجم الاستريو بشكل فعال، نقترح تقنية المسح الطائفي العمقي (DPS) التي تسمح بروابط أكثر كثافة واستخراج خصائص موجهة بالعمق. ثانيًا، للإمساك بالخصائص ذات المسافات المختلفة، نقدم حجم استريو جديد -- الحجم الاستريو ثنائي المنظور (DSV) الذي يدمج الخصائص الأمامية والعلوية ويقوم بإعادة بناء العمق الفرعي-البكسيلي في هرم الكاميرا. ثالثًا، مع انخفاض هيمنة المنطقة الأولى في الفضاء الثلاثي الأبعاد، نقترح استراتيجية تحرير البيانات متعددة الوسائط -- Stereo-LiDAR Copy-Paste، والتي تضمن التوافق بين الوسائط وتزيد من كفاءة البيانات. بدون أي تعقيدات زائدة,تظهر التجارب الواسعة في مجموعة متنوعة من الإعدادات الوسيطة على مقاييس KITTI الشهيرة أن طريقتنا تتفوق باستمرار على المستشعرات ثلاثية الأبعاد الأخرى القائمة على الكاميرا في جميع الفئات. يمكن الحصول على الرمز البرمجي من https://github.com/chenyilun95/DSGN2.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp