HyperAIHyperAI

Command Palette

Search for a command to run...

GrooMeD-NMS: NMS المجموع ذو الاشتقاق الرياضي للكشف عن الأشياء ثلاثية الأبعاد من خلال الكاميرا أحادية العدسة

Kumar Abhinav ; Brazil Garrick ; Liu Xiaoming

الملخص

الكشف عن الأشياء ثلاثية الأبعاد في العصر الحديث قد استفاد بشكل كبير من فكرة التعلم من البداية إلى النهاية. ومع ذلك، فإن معظم هذه الأنظمة تستخدم خوارزمية ما بعد المعالجة تُعرف بـ "القمع غير القصوى" (Non-Maximal Suppression - NMS) فقط أثناء الاستدلال. رغم وجود محاولات لدمج NMS في خط الأنابيب التدريبي لمهام مثل الكشف عن الأشياء ثنائية الأبعاد، إلا أنها لم تُعتمد على نطاق واسع بسبب عدم وجود تعبير رياضي واضح للـ NMS. في هذا البحث، نقدم ونقوم بدمج GrooMeD-NMS -- وهو نسخة جديدة من القمع المجموع والقابل للتفاضل رياضيًا (Grouped Mathematically Differentiable NMS) للكشف عن الأشياء ثلاثية الأبعاد أحادية العين، بحيث يتم تدريب الشبكة من البداية إلى النهاية مع دالة خسارة على الصناديق بعد تطبيق الـ NMS. نقوم أولًا بصياغة الـ NMS كعملية مصفوفة، ثم نقوم بتجميع وتغليف الصناديق بطريقة غير مراقبة للحصول على تعبير بسيط ومغلق للـ NMS. يعالج GrooMeD-NMS الاختلاف بين خطوط الأنابيب التدريب والاستدلال، وبالتالي يجبر الشبكة على اختيار أفضل صندوق ثلاثي الأبعاد بطريقة قابلة للتفاضل. نتيجة لذلك، حقق GrooMeD-NMS نتائجًا متقدمة في الكشف عن الأشياء ثلاثية الأبعاد أحادية العين على مجموعة بيانات KITTI المرجعية، حيث أداؤه مماثل لأداء طرق الفيديو أحادية العين. يمكن الوصول إلى الرموز والنماذج عبر الرابط: https://github.com/abhi1kumar/groomed_nms


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp