SageMix: مزيج موجه بالبروز للسحابات النقطية

تعتبر زيادة البيانات (Data Augmentation) من العناصر الأساسية لتحسين قدرة نماذج التعلم العميق على التعميم. يعتبر تقنية ميكساب (Mixup) طريقة بسيطة وشائعة الاستخدام في زيادة البيانات وقد أثبتت فعاليتها في تخفيف مشاكل الإفراط في التكيف (Overfitting) وندرة البيانات. كما أن الدراسات الحديثة حول ميكساب القائم على البارزة (Saliency-Aware Mixup) في مجال الصور تظهر أن الحفاظ على الأجزاء المميزة يفيد في تحسين أداء التعميم. ومع ذلك، فإن هذه التقنيات القائمة على ميكساب لم يتم استكشافها بشكل كافٍ في رؤية ثلاثية الأبعاد، خاصةً في السحب النقطية (Point Clouds). في هذا البحث، نقترح ساجمكس (SageMix)، وهو ميكساب موجه بالبارزة للسحب النقطية بهدف الحفاظ على الهياكل المحلية البارزة. تحديداً، نستخرج المناطق البارزة من سحابتين نقطيتين وندمجهما بسلاسة إلى شكل مستمر واحد. باستخدام عينة تسلسلية بسيطة بإعادة وزن درجات البارزة، يحافظ ساجمكس على البنية المحلية للمناطق البارزة. تظهر التجارب الواسعة أن الطريقة المقترحة تتخطى باستمرار طرق ميكساب الموجودة في مختلف مجموعات بيانات السحب النقطية المرجعية. عند استخدام نقطة نت بلس (PointNet++)، تحقق طرقتنا زيادة دقة بنسبة 2.6% و4.0% فوق التدريب القياسي في مجموعة بيانات 3D Warehouse (MN40) ومجموعة بيانات ScanObjectNN، على التوالي. بالإضافة إلى أداء التعميم، يحسن ساجمكس أيضًا المتانة وال-Calibration الشكوك (Uncertainty Calibration). علاوة على ذلك، عند تبني طرقتنا لأداء المهام المختلفة التي تشمل تقسيم الأجزاء وتقييم الصور ثنائية الأبعاد القياسية، فإن طرقتنا تحقق أداءً تنافسياً.