HyperAIHyperAI

Command Palette

Search for a command to run...

اكتشاف الأشياء ثلاثية الأبعاد من خلال كاميرا واحدة باستغلال اقتراحات دقيقة وإعادة بناء الشكل

Jason Ku; Alex D. Pon; Steven L. Waslander

الملخص

نقدم طريقة الكشف عن الأشياء ثلاثية الأبعاد من خلال كاميرا واحدة (MonoPSR)، والتي تعتمد على الاقتراحات وإعادة بناء الشكل. أولاً، باستخدام العلاقات الأساسية لنموذج الكاميرا ذات الثقب الإبرة، يتم استخدام اكتشافات من محدد كائنات ثنائي الأبعاد ناضج لإنشاء اقتراح ثلاثي الأبعاد لكل كائن في المشهد. تثبت مواقع هذه الاقتراحات أنها دقيقة للغاية، مما يقلل بشكل كبير من صعوبة تقدير الاكتشاف النهائي للصندوق الحدودي ثلاثي الأبعاد. وفي الوقت نفسه، يتم التنبؤ بسحابة نقاط في نظام إحداثيات مركز الكائن لتعلم المعلومات المحلية حول الحجم والشكل. ومع ذلك، فإن التحدي الرئيسي هو كيفية الاستفادة من معلومات الشكل لتوجيه تحديد الموقع ثلاثي الأبعاد. لذلك، قمنا بتصميم خسائر مجمعة، بما في ذلك خسارة تناسق الإسقاط الجديدة (projection alignment loss)، لتحسين دقة تحديد الموقع ثلاثي الأبعاد من خلال تحسين هذه المهام بشكل مشترك في الشبكة العصبية. لقد أجرينا اختبار طريquetنا على مقاييس KITTI حيث حققنا نتائج جديدة رائدة بين الطرق المنشرة التي تعتمد على كاميرا واحدة، بما في ذلك فئات المشاة وراكبي الدراجات الأكثر صعوبة، مع الحفاظ على وقت تشغيل فعال.请注意,最后一句中的“طريquetنا”是错误的,应该是“طريقتنا”。正确的翻译如下:نقدم طريقة الكشف عن الأشياء ثلاثية الأبعاد من خلال كاميرا واحدة (MonoPSR)، والتي تعتمد على الاقتراحات وإعادة بناء الشكل. أولاً، باستخدام العلاقات الأساسية لنموذج الكاميرا ذات الثقب الإبرة، يتم استخدام اكتشافات من محدد كائنات ثنائي الأبعاد ناضج لإنشاء اقتراح ثلاثي الأبعاد لكل كائن في المشهد. تثبت مواقع هذه الاقتراحات أنها دقيقة للغاية، مما يقلل بشكل كبير من صعوبة تقدير الاكتشاف النهائي للصندوق الحدودي ثلاثي الأبعاد. وفي الوقت نفسه، يتم التنبؤ بسحابة نقاط في نظام إحداثيات مركز الكائن لتعلم المعلومات المحلية حول الحجم والشكل. ومع ذلك، فإن التحدي الرئيسي هو كيفية الاستفادة من معلومات الشكل لتوجيه تحديد الموقع ثلاثي الأبعاد. لذلك، قمنا بتصميم خسائر مجمعة، بما في ذلك خسارة تناسق الإسقاط الجديدة (projection alignment loss)، لتحسين دقة تحديد الموقع ثلاثي الأبعاد من خلال تحسين هذه المهام بشكل مشترك في الشبكة العصبية. لقد أجرينا اختبار طريقتنا على مقاييس KITTI حيث حققنا نتائج جديدة رائدة بين الطرق المنشرة التي تعتمد على كاميرا واحدة، بما في ذلك فئات المشاة وراكبي الدراجات الأكثر صعوبة، مع الحفاظ على وقت تشغيل فعال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
اكتشاف الأشياء ثلاثية الأبعاد من خلال كاميرا واحدة باستغلال اقتراحات دقيقة وإعادة بناء الشكل | مستندات | HyperAI