الInstances ثلاثية الأبعاد كـ 1D Kernels

نقدّم تمثيلًا ثلاثي الأبعاد للInstances يُسمّى "النواة الـ Instance"، حيث تمثل الـ Instances بمتجهات أحادية البُعد تُشْفر المعلومات المعنى (السياقية)، والموقعية، وشكل الـ Instances ثلاثية الأبعاد. نُظهِر أن النوى الـ Instance تُمكّن من استخلاص الأقنعة بسهولة من خلال مجرد مسح النوى عبر المشهد بأكمله، مما يُقلّل من الاعتماد الشديد على المقترحات (proposals) أو الخوارزميات التجميعية التقديرية (heuristic clustering algorithms) التي تُستخدم في المسارات القياسية لفصل الـ Instances ثلاثية الأبعاد. يُستمد مفهوم النواة الـ Instance من النجاح الأخير للانحدار الديناميكي (dynamic convolutions) في مهام فصل الـ Instances ثنائية وثلاثية الأبعاد. ومع ذلك، نجد أن تمثيل الـ Instances ثلاثية الأبعاد ليس أمرًا سهلاً بسبب الطبيعة غير المرتبة وغير المُهيكلة لبيانات السحابة النقطية (point cloud data)، مثل ضعف دقة تحديد موقع الـ Instance، الذي يمكن أن يؤدي إلى تدهور كبير في تمثيل الـ Instance. لمعالجة هذا، نُنشئ نموذجًا جديدًا لتمثيل الـ Instances ثلاثية الأبعاد. أولاً، نحدد مراكز الـ Instances المحتملة كمرشحات. ثم نصمم خطة دمج للمرشحات تُجمِّع المرشحات المكررة في آنٍ واحد، وتُجمع السياق المحيط بالمركّزات المدمجة لتكوين النوى الـ Instance. بمجرد توفر النوى الـ Instance، يمكن استرجاع الأقنعة الـ Instance من خلال الانحدار الديناميكي (dynamic convolutions)، حيث تكون أوزانه مشروطة بنوى الـ Instance. تم تنفيذ العملية بأكملها باستخدام شبكة نوى ديناميكية (DKNet). تُظهر النتائج أن DKNet تتفوّق على أحدث التقنيات (state-of-the-art) على كلا مجموعتي بيانات ScanNetV2 وS3DIS، مع تحسين في دقة تحديد موقع الـ Instances. الكود متوفر على: https://github.com/W1zheng/DKNet.