HyperAIHyperAI

Command Palette

Search for a command to run...

CubifAE-3D: تكعيب الفضاء باستخدام الكاميرا الأحادية للكشف عن الأجسام ثلاثية الأبعاد المستند إلى الترميز الآلي

Shubham Shrivastava Punarjay Chakravarty

الملخص

نقدم طريقة للكشف عن الأجسام ثلاثية الأبعاد باستخدام صورة أحادية العين واحدة فقط. نبدأ من مجموعة بيانات مصنعة، حيث نقوم بتدريب مُشفر ومفكك الترميز RGB إلى العمق (Auto-Encoder) بشكل مسبق. يتم استخدام الترميز المُتعلم من هذا المشفر لتدريب شبكة اكتشاف الأجسام ثلاثية الأبعاد (3D Object Detector) CNN، والتي تستخدم للتنبؤ بمعلمات وضعيات الأجسام ثلاثية الأبعاد بعد أن يولد المشفر من AE ترميزًا كامنًا من الصورة RGB. نوضح أنه يمكن تدريب AE بشكل مسبق باستخدام صور RGB والعمق المترابطة من بيانات المحاكاة مرة واحدة، ومن ثم تدريب شبكة 3DOD فقط باستخدام البيانات الحقيقية، والتي تتكون من صور RGB ومعلمات وضعيات الأجسام ثلاثية الأبعاد (بدون الحاجة إلى عمق كثيف). تستفيد شبكتنا 3DOD من تقسيم خاص للمساحة ثلاثية الأبعاد حول الكاميرا إلى مكعبات، حيث يتم تكليف كل مكعب بالتنبؤ بـ N وضعيات للأجسام، بالإضافة إلى فئاتها وقيم الثقة الخاصة بها. يوفر التدريب المسبق للمشفر والمفكك الترميز (AE) وطريقة تقسيم المساحة ثلاثية الأبعاد حول الكاميرا إلى مكعبات اسم طريقتنا - CubifAE-3D. نعرض النتائج للكشف عن الأجسام ثلاثية الأبعاد بأحادي العين في حالة استخدام المركبات ذاتية القيادة مع مجموعة بيانات Virtual KITTI 2 ومجموعة بيانات KITTI.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp