HyperAIHyperAI

Command Palette

Search for a command to run...

LION: شبكات الذاكرة التكرارية الخطية لمعرفة الكائنات ثلاثية الأبعاد في السحابات النقطية

Zhe Liu Jinghua Hou Xinyu Wang Xiaoqing Ye Jingdong Wang Hengshuang Zhao Xiang Bai

الملخص

فوائد الشبكات التحويلية (transformers) في مهام الإدراك ثلاثي الأبعاد للسحابات النقطية الكبيرة، مثل كشف الأجسام ثلاثية الأبعاد، تقتصر بسبب تكلفتها الحسابية التربيعية عند نمذجة العلاقات طويلة المدى. بالمقابل، فإن الشبكات العصبية المتكررة الخطية (linear RNNs) لديها تعقيد حسابي منخفض وهي مناسبة لنمذجة العلاقات طويلة المدى. بهدف تحقيق هذا، نقترح إطارًا بسيطًا وفعالًا يعتمد على النوافذ والمبنَى على شبكات RNN الجماعية الخطية (LInear grOup RNN)، أي أداء RNN خطية للميزات المجمعة، للكشف الدقيق عن الأجسام ثلاثية الأبعاد، والذي نطلق عليه اسم LION. الخاصية الأساسية لهذا الإطار هي السماح بالتداخل الكافي للميزات في مجموعة أكبر بكثير من الطرق المستخدمة في الشبكات التحويلية. ومع ذلك، فإن تطبيق RNN الجماعية الخطية بشكل فعال على كشف الأجسام ثلاثية الأبعاد في السحابات النقطية شديدة الندرة ليس أمرًا بسيطًا بسبب قصورها في التعامل مع النمذجة الفضائية. لحل هذه المشكلة، نقدم ببساطة وصفة ميزات فضائية ثلاثية الأبعاد وندمجها في عمليات RNN الجماعية الخطية لتعزيز ميزاتها الفضائية بدلاً من زيادة عدد أوامر المسح لميزات الفوكسل بشكل عشوائي. لمعالجة التحدي في السحابات النقطية شديدة الندرة بشكل أكبر، نقترح استراتيجية إنشاء فوكسل ثلاثي الأبعاد لتثقيف ميزات المقدمة بفضل خاصية RNN الجماعية الخطية كنموذج ذاتي الانحدار الطبيعي. تؤكد التجارب الواسعة فعالية المكونات المقترحة والقابلية للتعميم لـ LION على مختلف مشغلي RNN الجماعية الخطية بما في ذلك Mamba و RWKV و RetNet. بالإضافة إلى ذلك، يجدر الذكر أن LION-Mamba حقق أفضل النتائج الحالية على مجموعات البيانات Waymo و nuScenes و Argoverse V2 و ONCE. وأخيراً وليس آخراً، يدعم طريقة عملنا أنواعًا متعددة من مشغلي RNN الجماعيين الخطيين المتقدمين (مثل RetNet و RWKV و Mamba و xLSTM و TTT) على مجموعة البيانات KITTI الصغيرة ولكن الشهيرة لتحقيق تجربة سريعة بإطارنا القائم على RNN الجماعي الخطي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp