HyperAIHyperAI
منذ 2 أشهر

iDisc: التجزئة الداخلية لتقدير العمق الأحادي العين

Luigi Piccinelli; Christos Sakaridis; Fisher Yu
iDisc: التجزئة الداخلية لتقدير العمق الأحادي العين
الملخص

التقدير الأحادي للعمق أساسي لفهم المشهد ثلاثي الأبعاد والتطبيقات اللاحقة. ومع ذلك، حتى في الإعداد المشرف عليه، لا يزال الأمر تحديًا ومشكلة غير محددة بشكل جيد بسبب نقص القيود الهندسية الكاملة. رغم أن المشهد يمكن أن يتكون من ملايين البكسلات، فإن هناك أنماطًا عليا أقل عددًا. نقترح iDisc لتعلم هذه الأنماط باستخدام التمثيلات المنفصلة الداخلية. يقسم هذا الأسلوب المشهد ضمنيًا إلى مجموعة من الأنماط العالية المستوى. وبشكل خاص، يُطبق وحدتنا الجديدة، التجزئة الداخلية (ID)، رقبة زجاجية مستمرة-منفصلة-مستمرة لتعلم هذه المفاهيم دون إشراف. على عكس أفضل الأساليب الحالية، لا يفرض النموذج المقترح أي قيود أو افتراضات صريحة على إخراج العمق. يمكن تدريب الشبكة بأكملها مع وحدة ID بطريقة شاملة بفضل وحدة الرقبة الزجاجية المستندة إلى الانتباه (الاهتمام). طرحنا يحدد حالة جديدة للفن بتحسينات كبيرة على NYU-Depth v2 و KITTI، ويتفوق على جميع الأساليب المنشورة في معيار KITTI الرسمي. يمكن أيضًا لـ iDisc تحقيق أفضل النتائج الحالية في تقدير الطبيع السطحي (surface normal estimation). بالإضافة إلى ذلك، نستكشف قدرة النموذج على التعميم عبر الاختبار بدون تصوير (zero-shot testing). نلاحظ الحاجة الملحة لتعزيز التنوع في السيناريو الخارجي. لذلك، نقدم تقسيمات لمجموعتين من بيانات القيادة الذاتية، وهما DDAD و Argoverse. يمكن الوصول إلى الكود في http://vis.xyz/pub/idisc .

iDisc: التجزئة الداخلية لتقدير العمق الأحادي العين | أحدث الأوراق البحثية | HyperAI