HyperAIHyperAI
منذ 2 أشهر

FSD V2: تحسين الكشف عن الأشياء ثلاثية الأبعاد بالكامل باستخدام البكسلات الافتراضية

Fan, Lue ; Wang, Feng ; Wang, Naiyan ; Zhang, Zhaoxiang
FSD V2: تحسين الكشف عن الأشياء ثلاثية الأبعاد بالكامل باستخدام البكسلات الافتراضية
الملخص

الهندسة المعمارية النادرة بالكامل المستندة إلى LiDAR (الليدار) حازت على اهتمام متزايد.يبرز FSDv1 كعمل ممثل، حيث حقق فعالية وكفاءة ملحوظتين، رغم تعقيد هياكله وتصميمه اليدوي. في هذا البحث، نقدم FSDv2، تطور يهدف إلى تبسيط FSDv1 السابق مع القضاء على التحيز الاستقرائي المُدخل من خلال تمثيله اليدوي على مستوى الحالة، مما يعزز قابلية التطبيق الشاملة بشكل أفضل. لتحقيق هذا الغرض، نقدم مفهوم البكسيلات الافتراضية (virtual voxels)، والتي تتولى عملية تقسيم الحالة المستندة إلى التجميع في FSDv1. البكسيلات الافتراضية لا تحل فقط مشكلة فقدان خاصية المركز الشائعة في الكاشفات النادرة بالكامل، بل تمنح الإطار أيضًا منهجًا أكثر أناقة وسلاسة. وبالتالي، طورنا مجموعة من المكونات لدعم مفهوم البكسيل الافتراضي، بما في ذلك مُشفر البكسيل الافتراضي (virtual voxel encoder)، ومُخلط البكسيل الافتراضي (virtual voxel mixer)، واستراتيجية تعيين البكسيل الافتراضي (virtual voxel assignment strategy). من خلال التحقق التجريبي، أظهرنا أن آلية البكسيل الافتراضي تكون وظيفيًا مشابهة للتجميع اليدوي في FSDv1 ولكنها أكثر عمومية. أجرينا تجارب على ثلاثة مجموعات بيانات كبيرة: مجموعة بيانات Waymo المفتوحة، ومجموعة بيانات Argoverse 2، ومجموعة بيانات nuScenes. أظهرت نتائجنا الأداء الرائد على جميع هذه المجموعات الثلاث، مما يؤكد تفوق FSDv2 في السيناريوهات الطويلة المدى وقدرتها على تحقيق أداء تنافسي عبر سيناريوهات متنوعة. علاوة على ذلك، نقدم تحليلًا تجريبيًا شاملًا لتوضيح كيفية عمل FSDv2. لتعزيز قابلية إعادة الإنتاج والبحث المتقدم، قمنا بفتح المصدر لـ FSDv2 على الرابط https://github.com/tusen-ai/SST.

FSD V2: تحسين الكشف عن الأشياء ثلاثية الأبعاد بالكامل باستخدام البكسلات الافتراضية | أحدث الأوراق البحثية | HyperAI