SpiderCNN: التعلم العميق على مجموعات النقاط باستخدام مرشحات تجميعية معامَلة

لقد حققت الشبكات العصبية العميقة نجاحًا ملحوظًا في مجموعة متنوعة من المهام المرتبطة بالرؤية، ومع ذلك لا يزال من الصعب تطبيق شبكات الCONV التقليدية (CNNs) على المجالات التي تفتقر إلى بنية أساسية منتظمة مثل السحب النقطية ثلاثية الأبعاد. بهدف التغلب على هذا التحدي، نقترح هندسة تجميعية جديدة أطلقنا عليها اسم SpiderCNN، وهي تعمل بكفاءة على استخراج الخصائص الهندسية من السحب النقطية. تتكون SpiderCNN من وحدات تسمى SpiderConv، والتي تمتد فيها عمليات التجميع من الشبكات المنتظمة إلى المجموعات النقطية غير المنتظمة التي يمكن أن تنغرز في R^n، وذلك عن طريق معاملة عائلة من مرشحات التجميع. صممنا المرشح كمنتج لدالة خطوة بسيطة تلتقط المعلومات الجيوديسية المحلية ومتعدد حدي تيلور يضمن التعبير. تستمد SpiderCNN هندستها الهرمية متعددة المقاييس من شبكات الCONV الكلاسيكية (CNNs)، مما يتيح لها استخراج خصائص عميقة ذات معنى. أظهرت التجارب على ModelNet40 أن SpiderCNN تحقق دقة قياسية بلغت 92.4% في المعايير القياسية، كما أثبتت أدائها التنافسي في مهمة تقسيم الأجزاء (segmentation).