DS-Depth: تقدير العمق الديناميكي والثابت من خلال حجم تكلفة مدمج

تستند طرق تقدير العمق من منظور واحد ذاتي التدريب عادةً على خطأ إعادة العرض لالتقاط العلاقات الهندسية بين الإطارات المتتالية في البيئات الثابتة. ومع ذلك، لا ينطبق هذا الافتراض في الأشياء الديناميكية ضمن السيناريوهات، مما يؤدي إلى أخطاء أثناء مرحلة تركيب المنظور، مثل عدم تطابق الميزات والاختناقات، التي يمكن أن تقلل بشكل كبير من دقة الخرائط العميقة الناتجة. لمعالجة هذه المشكلة، نقترح حجمًا ديناميكيًا جديدًا يُستخدَم فيه التدفق البصري المتبقِّي لوصف الأجسام المتحركة، مما يُحسّن المناطق التي تُختَنَق بشكل خاطئ في أحجام التكلفة الثابتة المستخدمة في الدراسات السابقة. ومع ذلك، فإن حجم التكلفة الديناميكي يُنتج بالضرورة اختناقات وضوضاء إضافية، لذا نخفف من هذه المشكلة من خلال تصميم وحدة دمج تُسهم في تعويض الحجمين الثابت والديناميكي عن بعضهما البعض. بعبارة أخرى، يتم تحسين الاختناقات الناتجة عن الحجم الثابت بواسطة الحجم الديناميكي، بينما يتم التخلص من المعلومات الخاطئة الناتجة عن الحجم الديناميكي بواسطة الحجم الثابت. علاوةً على ذلك، نقترح خسارة تجميع هرمية لتقليل عدم الدقة في الخطأ الفوتوغرافي عند الدقة المنخفضة، وخسارة خطأ فوتوغرافي تكيفية لتخفيف اتجاه التدفق في مناطق الاختناقات ذات المدرجات الكبيرة. أجرينا تجارب واسعة على مجموعتي بيانات KITTI وCityscapes، وأظهرت النتائج أن نموذجنا يتفوق على النماذج الأساسية المنشورة سابقًا لتقدير العمق من منظور واحد ذاتي التدريب.