HyperAIHyperAI

Command Palette

Search for a command to run...

ScanNet: إعادة بناء ثلاثية الأبعاد لمواقع داخلية مصحوبة بتعليقات غنية

Angela Dai; Angel X. Chang; Manolis Savva; Maciej Halber; Thomas Funkhouser; Matthias Nießner

الملخص

من المتطلبات الأساسية للاستفادة من طرق التعلم العميق المشرف عليها هو توفر قواعد بيانات كبيرة ومصنفة. للأسف، في سياق فهم المشاهد RGB-D، هناك القليل جداً من البيانات المتاحة -- تغطي القواعد الحالية نطاقاً محدوداً من زوايا المشاهد ولديها تسميات دلالية محدودة. لمعالجة هذه المشكلة، نقدم ScanNet (شبكة المسح)، وهي قاعدة بيانات فيديو RGB-D تحتوي على 2.5 مليون مشهد في 1513 مشهداً تم توثيقها بمواقع الكاميرا ثلاثية الأبعاد، وإعادة بناء السطوح، والتسميات الدلالية للقطع. لجمع هذه البيانات، صممنا نظاماً سهل الاستخدام وقابلًا للتتوسع لالتقاط بيانات RGB-D يشمل إعادة بناء السطوح بشكل آلي وتسمية دلالية جماعية. نوضح أن استخدام هذه البيانات يساعد في تحقيق أداء رائد في عدة مهام لفهم المشاهد ثلاثية الأبعاد، بما في ذلك تصنيف الأشياء ثلاثية الأبعاد، وتسمية البكسلات الدلالية، واسترجاع نماذج CAD (التصميم بالكمبيوتر). يمكن الحصول على القاعدة البيانات مجانًا من http://www.scan-net.org.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp