HyperAIHyperAI
منذ 11 أيام

اعتماد كاشف الكائنات ثلاثية الأبعاد بخطوة واحدة مع محول نادر

Lue Fan, Ziqi Pang, Tianyuan Zhang, Yu-Xiong Wang, Hang Zhao, Feng Wang, Naiyan Wang, Zhaoxiang Zhang
اعتماد كاشف الكائنات ثلاثية الأبعاد بخطوة واحدة مع محول نادر
الملخص

في الكشف ثلاثي الأبعاد عن الأجسام باستخدام تقنية LiDAR للقيادة الذاتية، يكون نسبة حجم الجسم إلى حجم المشهد المدخل أصغر بشكل ملحوظ مقارنة بحالات الكشف ثنائي الأبعاد. وبما أن العديد من مكتشفات الأجسام ثلاثية الأبعاد تتجاهل هذه الفجوة، فإنها تتبع بشكل مباشر الممارسة الشائعة في مكتشفات ثنائي الأبعاد، حيث تقوم بعملية تقليل الحجم (downsampling) لخرائط الميزات حتى بعد التكميم (quantization) لسحوبات النقاط. في هذه الورقة، نبدأ ب إعادة التفكير في تأثير هذا النمط المتكرر المتعدد الخطوات (multi-stride) على مكتشفات الأجسام ثلاثية الأبعاد المستندة إلى LiDAR. تشير تجاربنا إلى أن عمليات التقليل الحجم لا تُقدم فوائد كبيرة، بل تؤدي إلى فقدان لا مفر منه للمعلومات. ولعلاج هذه المشكلة، نقترح نموذج "Transformer النادر بخطوة واحدة" (Single-stride Sparse Transformer - SST)، الذي يحافظ على الدقة الأصلية للصورة طوال مسار الشبكة، من البداية إلى النهاية. وبفضل استخدام نماذج الـ Transformers، يعالج نهجنا مشكلة حقل الاستقبال (receptive field) المحدود في البنية ذات الخطوة الواحدة. كما يتكامل بشكل ممتاز مع طبيعة الندرة (sparsity) في سحوبات النقاط، ويتجنب بشكل طبيعي العمليات الحسابية المكلفة. في النهاية، يحقق نموذجنا SST أداءً متفوقًا على مستوى الحالة الحالية (state-of-the-art) على مجموعة بيانات Waymo Open Dataset الضخمة. ومن الجدير بالذكر أن طريقة عملنا تمكّن من تحقيق أداء مبهر (83.8 AP على مستوى 1 في مجموعة التحقق) في الكشف عن الأجسام الصغيرة (مثل المشاة)، وذلك بفضل خاصية الخطوة الواحدة. سيتم نشر الشفرة المصدرية على الرابط: https://github.com/TuSimple/SST

اعتماد كاشف الكائنات ثلاثية الأبعاد بخطوة واحدة مع محول نادر | أحدث الأوراق البحثية | HyperAI