HyperAIHyperAI
منذ 17 أيام

MuGNet: شبكة عصبية رسمية متعددة الدقة للتصنيف الكبير للسحابات النقطية

{Kenji Shimada, Tomotake Furuhata, Liuyue Xie}
الملخص

في هذه الورقة، نقترح بنية عميقة متعددة الدقة لتحليل السحابات النقطية الكثيفة على المستوى الشامل. تتطلب بيانات السحابات النقطية الكثيفة عملية ترميز خصائص مكلفة من الناحية الحسابية قبل التصنيف الشكلي. استخدمت الدراسات السابقة نهجًا مختلفًا لتقليل حجم السحابة النقطية الأصلية بشكل كبير، بهدف تمكين استخدام الأجهزة الحاسوبية الشائعة. وعلى الرغم من أن هذه النهج تخفف من العبء الحسابي إلى حد ما، إلا أنها ما زالت محدودة في قدرتها على معالجة عدة عمليات تصوير متعددة. نقدم نموذج MuGNet، وهو إطار عمل فعّال من حيث الذاكرة ويعمل بشكل مباشر (end-to-end) باستخدام الشبكات العصبية الرسومية، لتنفيذ التصنيف الشكلي على السحابات النقطية الكبيرة. ونُقلل من الطلب الحسابي من خلال استخدام شبكة عصبية رسومية على الرسومات النقطية المُعدّة مسبقًا، ونحافظ على دقة التصنيف من خلال شبكة ثنائية الاتجاه تقوم بدمج التضمينات المميزة على مستويات دقة مختلفة. وقد تم التحقق من إطارنا على مجموعات بيانات معيارية، تشمل مجموعة بيانات ستانفورد للفضاءات الداخلية ثلاثية الأبعاد على نطاق واسع (S3DIS) ومجموعة بيانات Virtual KITTI. ونُظهر أن إطارنا يمكنه معالجة ما يصل إلى 45 عملية تصوير لغرف في آنٍ واحد على بطاقة رسوميات واحدة بسعة 11 جيجابايت، مع تجاوز الحلول القائمة على الشبكات الرسومية الأخرى في التصنيف على S3DIS، حيث حقق دقة إجمالية بنسبة 88.5% (بزيادة 3%) ودقة mIOU بنسبة 69.8% (بزيادة 7.7%).