HyperAIHyperAI
منذ 18 أيام

Point-LGMask: دمج السياقات المحلية والعالمية للتدريب المسبق للسحابة النقطية باستخدام قناع متعدد النسب

{Min Chen, Yixue Hao, Long Hu, Qiao Yu, Jinfeng Xu, Xianzhi Li, Yuan Tang}
الملخص

لقد حققت التعلم ذاتي التدريب نجاحًا كبيرًا في معالجة اللغة الطبيعية والرؤية ثنائية الأبعاد، حيث يُعد نمذجة الحجب (masked modeling) إحدى طرق التدريب المُسبق الشائعة جدًا. ومع ذلك، فإن توسيع نطاق الحجب إلى فهم السحابات النقطية ثلاثية الأبعاد، التي تجمع بين السياقات المحلية والعالمية، يشكل تحديًا جديدًا. في هذا العمل، نقدّم طريقة جديدة تُسمى Point-LGMask، تهدف إلى دمج السياقات المحلية والعالمية من خلال تقنية الحجب متعددة النسب، وهي طريقة فعّالة جدًا لتعلم الميزات ذاتية التدريب للسحابات النقطية، لكنها تُهمل حاليًا في معظم الدراسات السابقة. وبشكل محدد، لتجنب التكيف مع نسبة حجب ثابتة، نقترح أولًا تقنية الحجب متعددة النسب، والتي تدفع المشفر (encoder) إلى استكشاف السمات الممثلة بشكل شامل بفضل مهام ذات صعوبات متفاوتة. ثم، لتشجيع دمج السمات المحلية والعالمية معًا، نُصاغ خسارة مركبة تتكون من جزأين: (أ) خسارة تقابلية للتمثيل العالمي، التي تُشجع على التزامن بين تخصيصات المجموعات للسحابات النقطية المُحجبة والتمثيل الكامل للمدخلات؛ و(ب) خسارة تنبؤ بالسحابة النقطية المحلية، التي تُشجع على تنبؤ دقيق بالنقاط المحجوبة. وباستخدام طريقة Point-LGMask، نُظهر أن التمثيلات المُكتسبة تُنقل بكفاءة عالية إلى مهام تطبيقية متعددة، بما في ذلك التصنيف القليل العينات (few-shot classification)، والتصنيف الشكلي، وتقسيم أجزاء الكائنات، بالإضافة إلى كشف الكائنات ثلاثية الأبعاد القائمة على المشاهد الواقعية وتصنيف المعاني ثلاثية الأبعاد. وبشكل خاص، يُقدّم نموذجنا تقدمًا كبيرًا على الطرق السابقة في مهمة التصنيف القليل العينات الصعبة باستخدام مجموعة بيانات ScanObjectNN المُسجّلة في العالم الحقيقي، حيث يتجاوز الأداء بنسبة أكثر من 4% عن أفضل طريقة سابقة. كما يحقق Point-LGMask مكاسب قدرها 0.4% في AP25 و0.8% في AP50 على مهمة كشف الكائنات ثلاثية الأبعاد مقارنة بالطريقة الثانية الأفضل. كما يحقق مكاسب بـ 0.4% في mAcc و0.5% في mIoU. تم إتاحة الشفرة المصدرية على الرابط التالي: https://github.com/TangYuan96/Point-LGMask

Point-LGMask: دمج السياقات المحلية والعالمية للتدريب المسبق للسحابة النقطية باستخدام قناع متعدد النسب | أحدث الأوراق البحثية | HyperAI