تقدير العمق في الصور الاستريو في أي وقت على الأجهزة المحمولة

تتطلب العديد من تطبيقات تقدير العمق الثنائي في الروبوتات إنشاء خرائط الاختلاف بدقة وفي الوقت الفعلي تحت قيود حسابية كبيرة. تجبر الخوارزميات الحالية الأكثر تقدماً على اختيار بين إنتاج تعيينات دقيقة ببطء أو إنتاج تعيينات غير دقيقة بسرعة، بالإضافة إلى أن هذه الطرق عادة ما تتطلب الكثير من المعلمات لدرجة أنها لا يمكن استخدامها على الأجهزة ذات القيود في الطاقة أو الذاكرة. دفعتنا هذه العيوب إلى اقتراح نهج جديد لتنبؤ الاختلاف في الإعداد "أي وقت". على عكس الأعمال السابقة، يمكن لنهجنا الذي تم تعلمه من البداية إلى النهاية التوفيق بين الحساب والدقة أثناء الاستدلال. يتم تقدير العمق على مراحل، حيث يمكن استعلام النموذج في أي وقت لإخراج أفضل تقدير حالي له. يمكن لنموذجنا النهائي معالجة صور بدقة 1242 × 375 بمعدل يتراوح بين 10-35 إطاراً في الثانية على وحدة NVIDIA Jetson TX2 مع زيادة طفيفة فقط في الخطأ -- باستخدام معلمات أقل بمقدار مرتبة حجمين من أقوى خط أساس (baseline). الرمز المصدر متاح على https://github.com/mileyan/AnyNet .