OneFormer3D: نموذج ترانسפורمر واحد للتصنيف الموحّد للسحابة النقطية

تم معالجة التجزئة الدلالية، والتجزئة الامتدادية، والتجزئة البانوبتيكية للسحاب النقطية ثلاثية الأبعاد باستخدام نماذج مخصصة لكل مهمة، بتصميمات مختلفة. وبذلك لم تُستغل بشكل فعّال التشابه بين جميع مهام التجزئة والعلاقة الضمنية بينها. يقدّم هذا البحث نموذجًا موحدًا وبسيطًا وفعّالًا يعالج جميع هذه المهام معًا. يُسمّى النموذج OneFormer3D، ويُنفّذ التجزئة الامتدادية والدلالية بشكل متسق، باستخدام مجموعة من النوى القابلة للتعلم، حيث تُسند كل نواة مسؤولية إنشاء قناع إما لكيان (Instance) أو لفئة دلالية. تُدرّس هذه النوى باستخدام معالج مبني على مُحولّ (Transformer) مع استخدام استفسارات موحدة للكيانات والتصنيفات الدلالية كمدخلات. يمكّن هذا التصميم من تدريب النموذج من البداية إلى النهاية في عملية واحدة، مما يُتيح تحقيق أفضل أداء على جميع مهام التجزئة الثلاث في آنٍ واحد. وبشكل خاص، يحتل OneFormer3D المرتبة الأولى ويُحدّد حالة جديدة من التقدم (زيادة +2.1 في mAP50) في قائمة التصنيف الخاصة بـ ScanNet. كما نُظهر نتائج تفوق الحد الأقصى المُسجّل في التجزئة الدلالية، والامتدادية، والبانوبتيكية على مجموعات بيانات ScanNet (+21 PQ)، وScanNet200 (+3.8 mAP50)، وS3DIS (+0.8 mIoU).