HyperAIHyperAI
منذ 2 أشهر

SqueezeSeg: شبكات العصب الاصطناعية التلافيفية مع CRF المتكررة لتمييز الأشياء على الطريق في الوقت الحقيقي من السحابة النقطية ثلاثية الأبعاد للليدار

Bichen Wu; Alvin Wan; Xiangyu Yue; Kurt Keutzer
SqueezeSeg: شبكات العصب الاصطناعية التلافيفية مع CRF المتكررة لتمييز الأشياء على الطريق في الوقت الحقيقي من السحابة النقطية ثلاثية الأبعاد للليدار
الملخص

في هذا البحث، نتناول تقسيم المعاني لعناصر الطرق من السحابات النقطية ثلاثية الأبعاد المُستخرجة من نظام ليدار (LiDAR). بشكل خاص، نرغب في اكتشاف وتَصنيف حالات ذات أهمية مثل السيارات والمشاة وراكبي الدراجات. نُصيغ هذه المشكلة كمشكلة تصنيف نقطة بنقطة، ونقترح خط أنابيب شاملًا يُسمى SqueezeSeg مبنيًا على شبكات العصب المتكررة (CNN): حيث تأخذ الشبكة العصبية المتكررة سحابة نقاط ليدار مُحولة كمدخل وتصدر مباشرةً خريطة تسميات نقطة بنقطة، والتي يتم تحسينها بعد ذلك بواسطة حقل عشوائي مشروط (CRF) مُطبق كطبقة متكررة. ثم يتم الحصول على التسميات على مستوى الحالة باستخدام خوارزميات التجميع التقليدية. تم تدريب نموذج شبكتنا العصبية المتكررة على سحابات نقاط ليدار من مجموعة بيانات KITTI، وتتماشى تسميات تقسيمنا النقطي مع الصناديق الحدودية ثلاثية الأبعاد من KITTI. للحصول على بيانات تدريب إضافية، قمنا ببناء محاكي ليدار داخل لعبة الفيديو الشهيرة Grand Theft Auto V (GTA-V)، لإنتاج كميات كبيرة من البيانات التدريبية الواقعية المُصنعة. أظهرت تجاربنا أن SqueezeSeg يحقق دقة عالية مع وقت تشغيل سريع ومُستقر بشكل مدهش (8.7 ملي ثانية لكل إطار)، وهو أمر مرغوب فيه للغاية في تطبيقات القيادة الذاتية. بالإضافة إلى ذلك، فإن التدريب الإضافي على البيانات المُصنعة يعزز دقة التحقق على البيانات الحقيقية. سيتم توفير شفرتنا المصدر والبيانات المُصنعة كمصدر مفتوح.

SqueezeSeg: شبكات العصب الاصطناعية التلافيفية مع CRF المتكررة لتمييز الأشياء على الطريق في الوقت الحقيقي من السحابة النقطية ثلاثية الأبعاد للليدار | أحدث الأوراق البحثية | HyperAI