PartNet: معيار كبير الحجم لفهم الأشياء ثلاثية الأبعاد على مستوى الأجزاء بدقة عالية وتسلسل هرمي

نقدم PartNet: قاعدة بيانات متسقة وذات نطاق واسع تتضمن نماذج أشياء ثلاثية الأبعاد مصحوبة بمعلومات دقيقة ومفصلة عن أجزائها على مستوى الحالة والهرم. تتكون قاعدة البيانات الخاصة بنا من 573,585 حالة جزء تغطي 26,671 نموذجًا ثلاثي الأبعاد ينتمي إلى 24 فئة من الأشياء. تمكن هذه القاعدة البيانات وتؤدي دورًا كمحفز لمهام عديدة مثل تحليل الشكل، ونمذجة المشاهد الديناميكية ثلاثية الأبعاد والمحاكاة، وتحليل القدرات الوظيفية وغيرها. باستخدام قاعدة البيانات الخاصة بنا، نحدد ثلاثة مهام مرجعية لتقييم التعرف على أجزاء الأجسام الثلاثية الأبعاد: التقسيم الدقيق للمعنى (fine-grained semantic segmentation)، التقسيم الهرمي للمعنى (hierarchical semantic segmentation)، والتقسيم على مستوى الحالة (instance segmentation). نقوم بتقييم أربع خوارزميات تعلم عميقة حديثة لتقسيم المعنى الدقيق وأساليب أساسية ثلاثة للتقسيم الهرمي للمعنى. كما نقترح طريقة جديدة للتعرف على حالات الأجزاء ونبين تفوقها على الأساليب الموجودة حاليًا.