استغلال الهندسة المحلية لبناء الميزات والرسوم البيانية لتحسين معالجة السحاب النقطي ثلاثي الأبعاد باستخدام الشبكات العصبية الرسومية

نُقدِّم تحسينات بسيطة ولكن فعّالة في تمثيل النقاط وبناء رسمية الجيران المحليين ضمن الإطار العام للشبكات العصبية الرسومية (GNNs) المعتمدة على معالجة سحابات النقاط ثلاثية الأبعاد. كمُساهمة أولى، نقترح تعزيز تمثيلات الرؤوس بملامح هندسية محلية مهمة للنقاط، تليها عملية تمرير غير خطية باستخدام شبكة عصبية متعددة الطبقات (MLP). كمُساهمة ثانية، نقترح تحسين بناء الرسمية للشبكات العصبية الرسومية المُستخدمة في سحابات النقاط ثلاثية الأبعاد. تعتمد الطرق الحالية على نهج قائمة على k-أقرب جيران (k-NN) لبناء الرسمية المحلية للجيران، ونُجادل بأن هذا الأسلوب قد يؤدي إلى تقليل التغطية في حالات التمثيل الكثيف الناتجة عن أجهزة الاستشعار في بعض مناطق المشهد. يهدف النهج المقترح إلى التصدي لهذه المشكلات وتحسين التغطية في مثل هذه الحالات. وبما أن الشبكات العصبية الرسومية التقليدية صُممت للعمل مع الرسومات العامة، حيث قد لا تكون للرؤوس تفسيرات هندسية، فإننا نرى أن كلا الاقتراحين يُعدان تحسينًا للرسومات العامة من خلال دمج الطبيعة الهندسية لسحابات النقاط ثلاثية الأبعاد. وعلى الرغم من بساطته، نُظهر من خلال مجموعة من المعايير الصعبة، بما في ذلك نماذج CAD نظيفة نسبيًا، بالإضافة إلى عمليات تصوير حقيقية مشوّشة، أن الطريقة المقترحة تحقق نتائج متفوّقة على المستويات الراهنة في معايير التصنيف ثلاثي الأبعاد (ModelNet40)، وتقسيم الأجزاء (ShapeNet)، والتقسيم الدلالي (Stanford 3D Indoor Scenes Dataset). كما نُظهر أن الشبكة المقترحة تحقق تقاربًا أسرع في التدريب، أي ما يقارب 40% أقل عدد من الدورات (epochs) للتصنيف. تفصيل المشروع متاح على الرابط التالي: https://siddharthsrivastava.github.io/publication/geomgcnn/