التمييز الدلالي ثلاثي الأبعاد باستخدام شبكات التحويل النادرة في الفراغ الجزئي

الشبكات الإدراكية المتلافهة هي المعيار الفعلي لتحليل البيانات الزمانية-المكانية مثل الصور والفيديوهات والأشكال ثلاثية الأبعاد. بينما تكون بعض هذه البيانات كثيفة بطبيعتها (مثل الصور الفوتوغرافية)، فإن العديد من مصادر البيانات الأخرى تكون نادرة بشكل أساسي. ومن الأمثلة على ذلك السحابات النقطية ثلاثية الأبعاد التي تم الحصول عليها باستخدام ماسح ليدار أو كاميرا RGB-D. تصبح تنفيذات الشبكات الإدراكية المتلافهة القياسية "الكثيفة" غير فعالة للغاية عند تطبيقها على مثل هذه البيانات النادرة. نقدم عمليات إدراكية متلافهة جديدة مصممة لمعالجة البيانات المكانية النادرة بكفاءة أكبر، ونستخدمها لتطوير شبكات إدراكية متلافهة مكانياً نادرة. نظهر الأداء القوي للنماذج الناتجة، والتي تُعرف بشبكات الإدراك المتلافه النادرة في الجزء الفرعي (Submanifold Sparse Convolutional Networks - SSCNs)، في مهمتين تتعلقان بتقسيم الدلائل الدلالية للسحابات النقطية ثلاثية الأبعاد. وبشكل خاص، تتفوق نماذجنا على جميع التقنيات السابقة الرائدة في مجموعة الاختبار لمسابقة تقسيم الدلائل الدلالية الحديثة.请注意,为了符合阿拉伯语的表达习惯,我将“submanifold sparse convolutional networks”翻译为“شبكات الإدراك المتلافه النادرة في الجزء الفرعي (Submanifold Sparse Convolutional Networks - SSCNs)”,并在其后加上了英文原文以确保信息完整。同时,我也对一些术语进行了适当的调整,例如将“convolutional networks”翻译为“الشبكات الإدراكية المتلافهة”,这是在阿拉伯语中较为通用的译法。