HyperAIHyperAI
منذ 11 أيام

(AF)²-S3Net: اندماج الميزات المُنتبهة مع اختيار الميزات المُعدّلة لشبكة التجزئة الدلالية النادرة

Ran Cheng, Ryan Razani, Ehsan Taghavi, Enxu Li, Bingbing Liu
(AF)²-S3Net: اندماج الميزات المُنتبهة مع اختيار الميزات المُعدّلة لشبكة التجزئة الدلالية النادرة
الملخص

تعتمد الأنظمة الروبوتية الذاتية القيادة والمركبات ذاتية القيادة على إدراك دقيق للبيئة المحيطة، حيث يُعدّ سلامة الركاب والمشاة أولوية قصوى. وتشكل التجزئة الدلالية (Semantic Segmentation) إحدى المكونات الأساسية في إدراك البيئة، حيث توفر معلومات دلالية عن المشهد. في الآونة الأخيرة، تم تقديم عدة طرق لتجزئة الدلالات ثلاثية الأبعاد باستخدام مستشعرات ليدار (3D LiDAR). وعلى الرغم من أن هذه الطرق يمكن أن تؤدي إلى تحسين الأداء، إلا أنها تعاني إما من تعقيد حسابي عالٍ، ما يجعلها غير فعّالة، أو تعاني من نقص في التفاصيل الدقيقة الخاصة بالكائنات الصغيرة. ولتخفيف هذه المشكلة، نقترح شبكة AF2-S3Net، وهي شبكة عصبية متعددة الطبقات (CNN) من نوع المشفر-المنشّط (encoder-decoder) تعمل بشكل متكامل (end-to-end) لتجزئة الدلالات ثلاثية الأبعاد باستخدام ليدار. ونقدّم في المشفر (encoder) وحدة تكامل مميزة للسمات ذات الفروع المتعددة مع توجيه انتباهي (multi-branch attentive feature fusion module)، وفي المنشّط (decoder) وحدة اختيار مميزة للسمات تتميّز بخاصية إعادة توزيع الأوزان للخرائط السمية (adaptive feature selection module with feature map re-weighting). وتُدمج شبكة AF2-S3Net بين التعلّم القائم على الفوكسل (voxel-based learning) والتعلّم القائم على النقاط (point-based learning) داخل إطار عمل واحد، مما يمكّنها من معالجة المشاهد ثلاثية الأبعاد الكبيرة بكفاءة عالية. وتُظهر النتائج التجريبية أن الطريقة المقترحة تتفوّق على أحدث الأساليب المطروحة على معيار SemanticKITTI الكبير، وتحتل المرتبة الأولى في قائمة التصنيف العامة التنافسية عند نشر الدراسة.

(AF)²-S3Net: اندماج الميزات المُنتبهة مع اختيار الميزات المُعدّلة لشبكة التجزئة الدلالية النادرة | أحدث الأوراق البحثية | HyperAI