{Jens Behley Ignacio Vizzo Cyrill Stachniss Andres Milioto}

الملخص
تُجرى عملية الإدراك في المركبات ذاتية القيادة غالبًا من خلال مجموعة متنوعة من وسائل الاستشعار. وبسبب الكمية الهائلة من البيانات المُصوّرة بلون RGB ذات التسمية المفتوحة، إلى جانب ظهور خوارزميات التعلم العميق عالية الجودة للتمييز القائم على الصور، تُحلّ المهام العليا للإدراك الدلالي بشكل أساسي باستخدام الكاميرات عالية الدقة. نتيجة لذلك، تُهمل غالبًا وسائل الاستشعار الأخرى التي قد تكون مفيدة لهذا الغرض. في هذا البحث، نُقدّم تقدمًا في مستوى التقنية الحالية في تجزئة الدلالة باستخدام ليدار فقط، بهدف توفير مصدر مستقل آخر للمعلومات الدلالية للمركبة. يُمكن لنهجنا إجراء تجزئة دلالية كاملة لسحوبات نقاط ليدار بدقة عالية وبمعدل تردد مستشعر ليدار. نستفيد من صور المدى (Range Images) كتمثيل وسيط، بالاقتران مع شبكة عصبية تلافيفية (CNN) تستفيد من نموذج حركة مستشعر ليدار الدوّار. ولتحقيق نتائج دقيقة، نقترح خوارزمية معالجة ما بعد جديدة تعالج المشكلات الناتجة عن هذا التمثيل الوسيط، مثل أخطاء التجزئة (Discretization Errors) ونتائج CNN الضبابية. تم تنفيذ نهجنا وتقييمه بشكل مفصل، بما في ذلك مقارنات متعددة مع أحدث التقنيات. تُظهر تجاربنا أن نهجنا يتفوق على الطرق الحالية، مع الاستمرار في العمل بشكل مباشر (Online) على وحدة معالجة رسوميات مدمجة واحدة. يمكن الوصول إلى الشفرة من خلال الرابط التالي: https://github.com/PRBonn/lidar-bonnetal
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| 3d-semantic-segmentation-on-semantickitti | RangeNet++ | test mIoU: 52.2% |
| robust-3d-semantic-segmentation-on | RangeNet-21 (64x2048) | mean Corruption Error (mCE): 136.33% |
| robust-3d-semantic-segmentation-on | RangeNet-53 (64x2048) | mean Corruption Error (mCE): 130.66% |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.