HyperAIHyperAI

Command Palette

Search for a command to run...

SqueezeSeg: شبكات العصب الاصطناعية التلافيفية مع CRF المتكررة لتمييز الأشياء على الطريق في الوقت الحقيقي من السحابة النقطية ثلاثية الأبعاد للليدار

Bichen Wu Alvin Wan Xiangyu Yue Kurt Keutzer

الملخص

في هذا البحث، نتناول تقسيم المعاني لعناصر الطرق من السحابات النقطية ثلاثية الأبعاد المُستخرجة من نظام ليدار (LiDAR). بشكل خاص، نرغب في اكتشاف وتَصنيف حالات ذات أهمية مثل السيارات والمشاة وراكبي الدراجات. نُصيغ هذه المشكلة كمشكلة تصنيف نقطة بنقطة، ونقترح خط أنابيب شاملًا يُسمى SqueezeSeg مبنيًا على شبكات العصب المتكررة (CNN): حيث تأخذ الشبكة العصبية المتكررة سحابة نقاط ليدار مُحولة كمدخل وتصدر مباشرةً خريطة تسميات نقطة بنقطة، والتي يتم تحسينها بعد ذلك بواسطة حقل عشوائي مشروط (CRF) مُطبق كطبقة متكررة. ثم يتم الحصول على التسميات على مستوى الحالة باستخدام خوارزميات التجميع التقليدية. تم تدريب نموذج شبكتنا العصبية المتكررة على سحابات نقاط ليدار من مجموعة بيانات KITTI، وتتماشى تسميات تقسيمنا النقطي مع الصناديق الحدودية ثلاثية الأبعاد من KITTI. للحصول على بيانات تدريب إضافية، قمنا ببناء محاكي ليدار داخل لعبة الفيديو الشهيرة Grand Theft Auto V (GTA-V)، لإنتاج كميات كبيرة من البيانات التدريبية الواقعية المُصنعة. أظهرت تجاربنا أن SqueezeSeg يحقق دقة عالية مع وقت تشغيل سريع ومُستقر بشكل مدهش (8.7 ملي ثانية لكل إطار)، وهو أمر مرغوب فيه للغاية في تطبيقات القيادة الذاتية. بالإضافة إلى ذلك، فإن التدريب الإضافي على البيانات المُصنعة يعزز دقة التحقق على البيانات الحقيقية. سيتم توفير شفرتنا المصدر والبيانات المُصنعة كمصدر مفتوح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp