HyperAIHyperAI
منذ 2 أشهر

SEGCloud: تقسيم الدلالة للسحابات النقطية ثلاثية الأبعاد

Lyne P. Tchapmi; Christopher B. Choy; Iro Armeni; JunYoung Gwak; Silvio Savarese
SEGCloud: تقسيم الدلالة للسحابات النقطية ثلاثية الأبعاد
الملخص

التسمية المشهدية ثلاثية الأبعاد هي أساسية للوكلاء العاملين في العالم الحقيقي. وبشكل خاص، فإن تسمية المجموعات النقطية ثلاثية الأبعاد الخام من المستشعرات توفر معانيًا دقيقة التفاصيل. ومع ذلك، فإن الأعمال الحديثة تستفيد من قدرات الشبكات العصبية (Neural Networks)، ولكنها محدودة بالتنبؤات الخشنة للمكعبات ولا تفرض صراحةً التناسق العالمي. نقدم SEGCloud، وهو إطار شامل من البداية إلى النهاية للحصول على تقسيم على مستوى النقاط الثلاثية الأبعاد، والذي يجمع بين مزايا الشبكات العصبية والتقريب الثلاثي الخطي (Trilinear Interpolation) والمجالات العشوائية الشرطية المتصلة بالكامل (Fully Connected Conditional Random Fields). يتم نقل التنبؤات الخشنة للمكعبات من شبكة عصبية متكررة بالكامل ثلاثية الأبعاد مرة أخرى إلى النقاط النقطية ثلاثية الأبعاد الخام عبر التقريب الثلاثي الخطي. ثم تقوم المجالات العشوائية الشرطية المتصلة بالكامل بفرض التناسق العالمي وتوفير معاني دقيقة التفاصيل على النقاط. نقوم بتنفيذ الجزء الأخير كشبكة عصبية متكررة قابلة للتفاضل لتمكين التحسين المشترك. نقيم الإطار على مجموعتين من البيانات ثلاثية الأبعاد داخل المباني ومجموعتين خارج المباني (NYU V2، S3DIS، KITTI، Semantic3D.net)، ونظهر أداءً مماثلاً أو أفضل من الحالة الأكثر تقدمًا في جميع مجموعات البيانات.