HyperAIHyperAI
منذ 2 أشهر

LION: شبكات الذاكرة التكرارية الخطية لمعرفة الكائنات ثلاثية الأبعاد في السحابات النقطية

Zhe Liu; Jinghua Hou; Xinyu Wang; Xiaoqing Ye; Jingdong Wang; Hengshuang Zhao; Xiang Bai
LION: شبكات الذاكرة التكرارية الخطية لمعرفة الكائنات ثلاثية الأبعاد في السحابات النقطية
الملخص

فوائد الشبكات التحويلية (transformers) في مهام الإدراك ثلاثي الأبعاد للسحابات النقطية الكبيرة، مثل كشف الأجسام ثلاثية الأبعاد، تقتصر بسبب تكلفتها الحسابية التربيعية عند نمذجة العلاقات طويلة المدى. بالمقابل، فإن الشبكات العصبية المتكررة الخطية (linear RNNs) لديها تعقيد حسابي منخفض وهي مناسبة لنمذجة العلاقات طويلة المدى. بهدف تحقيق هذا، نقترح إطارًا بسيطًا وفعالًا يعتمد على النوافذ والمبنَى على شبكات RNN الجماعية الخطية (LInear grOup RNN)، أي أداء RNN خطية للميزات المجمعة، للكشف الدقيق عن الأجسام ثلاثية الأبعاد، والذي نطلق عليه اسم LION. الخاصية الأساسية لهذا الإطار هي السماح بالتداخل الكافي للميزات في مجموعة أكبر بكثير من الطرق المستخدمة في الشبكات التحويلية. ومع ذلك، فإن تطبيق RNN الجماعية الخطية بشكل فعال على كشف الأجسام ثلاثية الأبعاد في السحابات النقطية شديدة الندرة ليس أمرًا بسيطًا بسبب قصورها في التعامل مع النمذجة الفضائية. لحل هذه المشكلة، نقدم ببساطة وصفة ميزات فضائية ثلاثية الأبعاد وندمجها في عمليات RNN الجماعية الخطية لتعزيز ميزاتها الفضائية بدلاً من زيادة عدد أوامر المسح لميزات الفوكسل بشكل عشوائي. لمعالجة التحدي في السحابات النقطية شديدة الندرة بشكل أكبر، نقترح استراتيجية إنشاء فوكسل ثلاثي الأبعاد لتثقيف ميزات المقدمة بفضل خاصية RNN الجماعية الخطية كنموذج ذاتي الانحدار الطبيعي. تؤكد التجارب الواسعة فعالية المكونات المقترحة والقابلية للتعميم لـ LION على مختلف مشغلي RNN الجماعية الخطية بما في ذلك Mamba و RWKV و RetNet. بالإضافة إلى ذلك، يجدر الذكر أن LION-Mamba حقق أفضل النتائج الحالية على مجموعات البيانات Waymo و nuScenes و Argoverse V2 و ONCE. وأخيراً وليس آخراً، يدعم طريقة عملنا أنواعًا متعددة من مشغلي RNN الجماعيين الخطيين المتقدمين (مثل RetNet و RWKV و Mamba و xLSTM و TTT) على مجموعة البيانات KITTI الصغيرة ولكن الشهيرة لتحقيق تجربة سريعة بإطارنا القائم على RNN الجماعي الخطي.

LION: شبكات الذاكرة التكرارية الخطية لمعرفة الكائنات ثلاثية الأبعاد في السحابات النقطية | أحدث الأوراق البحثية | HyperAI