MKConv: تمثيل متعدد الأبعاد للميزات لتحليل سحابات النقاط

على الرغم من النجاح الباهر للتعلم العميق، لا يزال هناك صعوبة في تحقيق عملية ت convolution مثالية على السحاب النقطية نظرًا لهيكلها غير المنتظم. تركز الطرق الحالية بشكل رئيسي على تصميم دالة نواة مستمرة فعالة قادرة على التعامل مع نقطة عشوائية في الفضاء المستمر. وتم اقتراح العديد من الطرق ذات الأداء العالي، لكننا لاحظنا أن تمثيل الميزات النقطية القياسية يتم عبر قنوات أحادية البعد (1D)، ويمكن أن يصبح أكثر إفادة عند تضمينه لمساحات مميزة إضافية. في هذه الورقة، نقدّم عملية convolutio جديدة تُسمى ت convolution النواة متعددة الأبعاد (MKConv)، والتي تتعلم تحويل تمثيل ميزة النقطة من متجه إلى مصفوفة متعددة الأبعاد. على عكس الت convolution النقطية القياسية، يسير MKConv عبر خطوتين: (1) يُفعّل أولاً الأبعاد المكانية لتمثيل الميزة المحلية من خلال استغلال أوزان النواة متعددة الأبعاد، مما يُمكّن الميزات الموسّعة مكانيًا من تمثيل معلوماتها المضمنة من خلال الترابط المكاني والارتباط القناتي في فضاء الميزات، وبالتالي حمل معلومات أكثر تفصيلًا حول البنية المحلية. (2) ثم يتم تطبيق عمليات convolutio منفصلة على الميزات متعددة الأبعاد، والتي يمكن اعتبارها مصفوفة ذات هيكل شبكي. وبهذا نتمكن من استخدام عمليات convolutio المنفصلة على بيانات السحاب النقطية دون الحاجة إلى التحويل إلى مكعبات (Voxelization)، ما يقلل من فقدان المعلومات. بالإضافة إلى ذلك، نقترح وحدة انتباه مكانية تُسمى الانتباه المحلي متعدد الأبعاد (MLA)، والتي توفر وعيًا شاملاً بالبنية داخل المجموعة المحلية للنقط من خلال إعادة توزيع الأوزان على الأبعاد المكانية. ونُظهر أن MKConv يتمتع بقابلية تطبيقية ممتازة على مهام معالجة السحاب النقطية، بما في ذلك تصنيف الكائنات، وتقسيم أجزاء الكائنات، وتقسيم معاني المشهد، مع تحقيق نتائج متفوقة.