DeFlow: محكّم شبكة التدفق المشهدي في القيادة الذاتية

تقدير تدفق المشهد يحدد حقل الحركة ثلاثي الأبعاد للمشهد، من خلال التنبؤ بحركة النقاط في المشهد، خاصة لدعم المهام في القيادة الذاتية. يستخدم العديد من الشبكات التي تتلقى السحابات النقطية الكبيرة كمدخلات تقسيم الفضاء إلى مكعبات صغيرة (Voxelization) لإنشاء صورة شبه حقيقية للتشغيل في الوقت الحقيقي. ومع ذلك، غالبًا ما يؤدي عملية التقسيم إلى مكعبات صغيرة إلى فقدان الخصائص الخاصة بالنقاط. هذا يثير تحديًا في استعادة تلك الخصائص لمهام تدفق المشهد. يقدم بحثنا DeFlow، والذي يسمح بالانتقال من الخصائص المستندة إلى المكعبات الصغيرة إلى خصائص النقاط باستخدام تحسين وحدة التكرار المرتّبة (Gated Recurrent Unit - GRU). لتعزيز أداء تقدير تدفق المشهد بشكل أكبر، نقوم بصياغة دالة خسارة جديدة تأخذ في الاعتبار عدم التوازن بين البيانات للنقاط الثابتة والنقاط المتحركة. أظهرت التقييمات على مهمة تدفق المشهد في Argoverse 2 أن DeFlow حقق نتائج متقدمة على بيانات السحابة النقطية الكبيرة، مما يدل على أن شبكتنا لديها أداء وكفاءة أفضل مقارنة بالشبكات الأخرى. تم توفير الكود كمصدر مفتوح على الرابط https://github.com/KTH-RPL/deflow.