HyperAIHyperAI
منذ 2 أشهر

ScanNet: إعادة بناء ثلاثية الأبعاد لمواقع داخلية مصحوبة بتعليقات غنية

Angela Dai; Angel X. Chang; Manolis Savva; Maciej Halber; Thomas Funkhouser; Matthias Nießner
ScanNet: إعادة بناء ثلاثية الأبعاد لمواقع داخلية مصحوبة بتعليقات غنية
الملخص

من المتطلبات الأساسية للاستفادة من طرق التعلم العميق المشرف عليها هو توفر قواعد بيانات كبيرة ومصنفة. للأسف، في سياق فهم المشاهد RGB-D، هناك القليل جداً من البيانات المتاحة -- تغطي القواعد الحالية نطاقاً محدوداً من زوايا المشاهد ولديها تسميات دلالية محدودة. لمعالجة هذه المشكلة، نقدم ScanNet (شبكة المسح)، وهي قاعدة بيانات فيديو RGB-D تحتوي على 2.5 مليون مشهد في 1513 مشهداً تم توثيقها بمواقع الكاميرا ثلاثية الأبعاد، وإعادة بناء السطوح، والتسميات الدلالية للقطع. لجمع هذه البيانات، صممنا نظاماً سهل الاستخدام وقابلًا للتتوسع لالتقاط بيانات RGB-D يشمل إعادة بناء السطوح بشكل آلي وتسمية دلالية جماعية. نوضح أن استخدام هذه البيانات يساعد في تحقيق أداء رائد في عدة مهام لفهم المشاهد ثلاثية الأبعاد، بما في ذلك تصنيف الأشياء ثلاثية الأبعاد، وتسمية البكسلات الدلالية، واسترجاع نماذج CAD (التصميم بالكمبيوتر). يمكن الحصول على القاعدة البيانات مجانًا من http://www.scan-net.org.

ScanNet: إعادة بناء ثلاثية الأبعاد لمواقع داخلية مصحوبة بتعليقات غنية | أحدث الأوراق البحثية | HyperAI