نيمبل دي: تحسين التقدير التلقائي للعمق من منظور واحد باستخدام التسميات الاصطناعية والتدريب المسبق على فيديو بحجم كبير

نقدّم نيمبل داي (NimbleD)، وهي إطار عمل فعّال لتقدير العمق من كاميرا واحدة بدون تعلّم مراقب، يدمج إشرافًا من علامات افتراضية تم إنشاؤها بواسطة نموذج رؤية كبير. لا يتطلب هذا الإطار معرفة بمعاملات الكاميرا الداخلية، مما يمكّن من التدريب المسبق على نطاق واسع باستخدام مقاطع فيديو متاحة علنًا. تُعدّ الاستراتيجية التعلّمية البسيطة ولكن الفعّالة التي نقترحها مساهمة كبيرة في تحسين أداء النماذج السريعة والخفيفة دون إدخال أي عبء إضافي، مما يسمح لها بتحقيق أداء مماثل للنماذج الرائدة حاليًا في تقدير العمق من كاميرا واحدة بدون تعلّم مراقب. يُعدّ هذا التقدّم مفيدًا بشكل خاص للتطبيقات الواقع الافتراضي والواقع المعزز التي تتطلب استدلالًا منخفض التأخير. يمكن الوصول إلى الشفرة المصدرية، وثقل النموذج، والتقديرات الاعتراف بالجهود من خلال الرابط التالي: https://github.com/xapaxca/nimbled.