FG-Net: شبكة فهم سريعة وعالية الحجم للسحاب النقطية ليدار تُستَخدَم استخراج الميزات المرتبطة ونمذجة الوعي الهندسي

تقدم هذه الدراسة نموذج FG-Net، وهو إطار تعلم عميق عام لفهم السحابات النقطية الضخمة دون الحاجة إلى التبديل إلى مكعبات (Voxelization)، ويحقق أداءً دقيقًا وفعّالًا في الزمن الحقيقي باستخدام بطاقة NVIDIA GTX 1080 واحدة. أولاً، تم تصميم طريقة جديدة لتصفية الضوضاء والقيم الشاذة (outliers) لتسهيل المهام عالية المستوى اللاحقة. ولتحقيق فهم فعّال، نقترح شبكة عصبية متعددة الطبقات (CNN) عميقة تعتمد على استخراج الميزات المرتبطة والنمذجة الهندسية المستندة إلى التحوير المرن (deformable convolution)، مما يمكّن من استغلال العلاقات الموضعية بين الميزات والأنماط الهندسية بشكل كامل. وبالنسبة لمشكلة الكفاءة، نُقدّم عملية عينة عكسية حسب الكثافة (inverse density sampling) واستراتيجية تعلم متبقية تعتمد على الهرم المميز (feature pyramid-based residual learning) لتقليل تكلفة الحساب واستهلاك الذاكرة على التوالي. أظهرت التجارب الواسعة على مجموعات بيانات واقعية صعبة أن منهجياتنا تتفوّق على الطرق الرائدة في مجالها من حيث الدقة والكفاءة. علاوةً على ذلك، تم إجراء تعلم نقل مُراقب بشكل ضعيف (weakly supervised transfer learning) لتوضيح قدرة التعميم الخاصة بمنهجنا.