ISBNet: شبكة تصنيف مثيلات سحابة نقاط ثلاثية الأبعاد تتميز بعينة واعية بالمثيل وانسيابية ديناميكية واعية بالصندوق

تُهيمن على الطرق الحالية لتقسيم الكائنات ثلاثية الأبعاد التصميم من الأسفل – حيث يتم تحسين خوارزمية يدوياً لدمج النقاط في مجموعات (كلاسترات)، تليها شبكة تحسين. ومع ذلك، تُنتج هذه الطرق نتائج عرضة للتأثر بجودة المجموعات، خصوصاً في الحالتين التاليتين: (1) عندما تكون الكائنات القريبة ذات الفئة الدلالية نفسها مجمعة مع بعضها، أو (2) عندما تكون الكائنات الكبيرة تحتوي على مناطق مترابطة بشكل فضفاض. لمعالجة هذه القيود، نقدّم ISBNet، وهي طريقة جديدة لا تعتمد على المجموعات، حيث تمثل الكائنات كـ "نُوى" (kernels) وتحلل أقنعة الكائنات عبر الت convolution الديناميكي. ولإنتاج نُوى فعّالة ذات تغطية عالية وتمييز قوي، نقترح استراتيجية بسيطة تُسمى "أبعد نقطة مُتَعَلِّقة بالكائن" (Instance-aware Farthest Point Sampling) لاختيار المرشحات، ونستخدم طبقة تجميع محلية مستوحاة من PointNet++ لتمثيل سمات المرشحات. علاوةً على ذلك، نُظهر أن التنبؤ بحدود الصندوق المحاطة بالمحاور الثلاثية الأبعاد (3D axis-aligned bounding boxes) واستخدامها في الت convolution الديناميكي يُعزّز الأداء بشكل ملحوظ. حققت طريقة العمل هذه نتائج جديدة قياسية على مجموعات بيانات ScanNetV2 (55.9)، وS3DIS (60.8)، وSTPLS3D (49.2) من حيث AP، مع الحفاظ على زمن استجابة سريع (237 مللي ثانية لكل مشهد على ScanNetV2). يتوفر الشفرة المصدرية والنماذج المدربة على الرابط: https://github.com/VinAIResearch/ISBNet.