توسيع السحابة النقطية باستخدام تحويلات محلية موزونة

على الرغم من الاستخدام الواسع للسحابات النقطية في الرؤية ثلاثية الأبعاد، فإن كمية البيانات المتاحة لتدريب الشبكات العصبية العميقة تظل محدودة نسبيًا. وعلى الرغم من أن تكبير البيانات (data augmentation) يُعد من الأساليب القياسية لتعويض نقص البيانات، إلا أنه لم يُدرَس بشكل واسع في الأدبيات المتعلقة بالسحابات النقطية. في هذه الورقة، نقترح طريقة بسيطة وفعّالة لتكبير السحابات النقطية تُسمى PointWOLF. تعتمد الطريقة المُقترحة على إنتاج تشوهات غير مرنة سلسة من خلال تحويلات محلية موزونة تتمحور حول عدة نقاط مرجعية متعددة. تسمح هذه التشوهات السلسة بإنشاء تكبيرات متنوعة وواقعية. علاوةً على ذلك، ولتقليل الجهد اليدوي المطلوب للبحث عن القيم المثلى للبارامترات الفائقة (hyperparameters) الخاصة بالتكبير، نقدّم أداة تُسمى AugTune، والتي تُولّد عينات مُكبّرة بمستويات صعوبة مطلوبة، وتُحقق درجات ثقة مستهدفة. تُظهر التجارب التي أجريناها أن إطار عملنا يُحسّن باستمرار الأداء في مهام تصنيف الأشكال وتقسيم الأجزاء. وبشكل خاص، باستخدام PointNet++، حقق PointWOLF أفضل أداء مُسجّل حتى الآن بتحقيق دقة قدرها 89.7% في تصنيف الأشكال باستخدام مجموعة بيانات ScanObjectNN الواقعية.