HyperAIHyperAI
منذ 13 أيام

GS-Occ3D: توسيع إعادة بناء الاشغال فقط بالرؤية باستخدام التبقيت الغاوسي

Baijun Ye, Minghui Qin, Saining Zhang, Moonjun Gong, Shaoting Zhu, Zebang Shen, et al
GS-Occ3D: توسيع إعادة بناء الاشغال فقط بالرؤية باستخدام التبقيت الغاوسي
الملخص

الاستخدام (Occupancy) يُعد عنصرًا حاسمًا في القيادة الذاتية، حيث يُوفّر معلومات هندسية أساسية لمهام الاستشعار والتخطيط. ومع ذلك، تعتمد الطرق الحالية بشكل كبير على تسميات الاستخدام المستندة إلى ليدار، مما يحد من قابليتها للتوسع ويمنع الاستفادة من كمّ هائل من البيانات التي يمكن جمعها من مصادر جماعية لتصنيف التلقائي. ولحل هذه المشكلة، نقترح نموذج GS-Occ3D، وهو إطار عمل قابل للتوسع يعتمد بالكامل على الرؤية (Vision-only) ويُعيد بناء استخدام المساحة مباشرةً. لكن إعادة بناء الاستخدام باستخدام الرؤية فقط تواجه تحديات كبيرة ناتجة عن زوايا رؤية نادرة، وعناصر متحركة في المشهد، واحتقانات شديدة، وحركات طويلة المدى. وتُعتمد الطرق القائمة على الرؤية حاليًا بشكل رئيسي على تمثيل الشبكة (Mesh)، التي تعاني من نقص في البنية الهندسية وتحتاج إلى معالجات إضافية بعد التصنيف، مما يحد من قابليتها للتوسع. ولتجاوز هذه التحديات، يُحسّن نموذج GS-Occ3D تمثيلًا صريحًا للاستخدام باستخدام صيغة مبنية على مُكعب (Octree) لـ "غاوسيان سيرفل" (Gaussian Surfel)، مما يضمن الكفاءة والقابلية للتوسع. علاوةً على ذلك، نُقسّم المشاهد إلى خلفية ثابتة، وسطح الأرض، والكائنات المتحركة، مما يمكّن من تطبيق استراتيجيات نمذجة مخصصة: (1) إعادة بناء سطح الأرض بشكل صريح كعنصر هيكلية بارزة، مما يُحسّن بشكل كبير اتساق المناطق الواسعة؛ (2) نمذجة الكائنات المتحركة (مثل المركبات) بشكل منفصل، لتحسين التقاط الأنماط المتعلقة بالحركة. أظهرت التجارب الواسعة على مجموعة بيانات Waymo نتائج متميزة في إعادة بناء الهندسة، حيث تفوقت GS-Occ3D على جميع النماذج السابقة. وباستخدام تسميات ثنائية للاستخدام تعتمد على الرؤية من مشاهد حضرية متنوعة، أثبتنا فعالية هذه التسميات في تدريب نماذج الاستخدام لاحقة على مجموعة Occ3D-Waymo، كما أظهرت أداءً متفوقًا في التعميم من الصفر (zero-shot) على مجموعة Occ3D-nuScenes. وتُبرز هذه النتائج الإمكانات الكبيرة لإعادة بناء الاستخدام القائم على الرؤية على نطاق واسع، كنمط جديد لتصنيف التلقائي القابل للتوسع. صفحة المشروع: هذا الرابط https URL