HyperAIHyperAI
منذ 2 أشهر

توليد المقترحات ثلاثية الأبعاد وكشف الأشياء من خلال تجميع وجهات النظر

Jason Ku; Melissa Mozifian; Jungwook Lee; Ali Harakeh; Steven Waslander
توليد المقترحات ثلاثية الأبعاد وكشف الأشياء من خلال تجميع وجهات النظر
الملخص

نقدم شبكة AVOD، وهي شبكة كشف الأشياء المجمعة للمناظر في القيادة الذاتية. تتضمن الهندسة المقترحة للشبكة العصبية استخدام سحب نقاط LIDAR والصور RGB لإنشاء ميزات يتم مشاركتها بين شبكتين فرعيتين: شبكة اقتراح المناطق (RPN) وشبكة الكشف في المرحلة الثانية. تستخدم الشبكة المقترحة لـ RPN هندسة جديدة قادرة على تنفيذ دمج الميزات متعددة الأوضاع على خرائط الميزات ذات الدقة العالية لتوليد اقتراحات أشياء ثلاثية الأبعاد موثوقة لفئات متعددة من الأشياء في المناظر الطرقية. باستخدام هذه الاقتراحات، تقوم شبكة الكشف في المرحلة الثانية بتنفيذ الانحدار الدقيق للصندوق الحدودي الثلاثي الأبعاد والمصنف الفئوي لتوقع مدى و定向 (orientation) وتقييم تصنيف الأشياء في الفضاء الثلاثي الأبعاد. لقد أظهرت الهندسة المقترحة أنها تنتج نتائج رائدة على معيار KITTI لكشف الأشياء ثلاثية الأبعاد بينما تعمل بشكل مباشر وفي الوقت الحقيقي مع استهلاك ذاكرة منخفض، مما يجعلها مرشحًا مناسبًا للاستخدام في السيارات ذاتية القيادة. الرمز موجود في: https://github.com/kujason/avod注释:在“定向”一词后添加了英文原词(orientation),以确保信息的完整性。