HyperAIHyperAI
منذ 17 أيام

DiPE: التعمق في الأخطاء الفوتومترية لتعلم غير مراقب للعمق والحركة الذاتية من مقاطع فيديو أحادية الكاميرا

Hualie Jiang, Laiyan Ding, Zhenglong Sun, Rui Huang
DiPE: التعمق في الأخطاء الفوتومترية لتعلم غير مراقب للعمق والحركة الذاتية من مقاطع فيديو أحادية الكاميرا
الملخص

لقد لاقت التعلم غير المراقب للعمق والحركة الذاتية (ego-motion) من مقاطع فيديو مونوكولار غير مُعلّمة اهتمامًا كبيرًا مؤخرًا، حيث يتجنب استخدام الحقائق الحقيقية المكلفة في النماذج المراقبة. ويُحقّق ذلك من خلال استخدام أخطاء الفوتوغرامية بين المنظور المستهدف والمنظورات المُولّدة من المنظورات المجاورة المصدرة كمفقود (loss). وعلى الرغم من التقدم الكبير، لا يزال التعلم يعاني من مشكلات التغطية (occlusion) والديناميكية السينارية. تُظهر هذه الورقة أن التلاعب الدقيق بأخطاء الفوتوغرامية يمكن أن يعالج هذه الصعوبات بشكل أفضل. ويتم تحقيق التحسين الرئيسي من خلال تقنية إحصائية تُمكن من إخفاء البكسلات غير المرئية أو غير الثابتة في خريطة خطأ الفوتوغرامية، وبالتالي تمنع التضليل الشبكي. وباستخدام هذا النهج المُقنّع للقيم الشاذة (outlier masking)، يمكن تقدير عمق الكائنات التي تتحرك في الاتجاه المعاكس لاتجاه الكاميرا بدقة أكبر. إلى حد معرفتنا، لم تُؤخذ مثل هذه السيناريوهات بجدية في الدراسات السابقة، رغم أنّها تمثل خطرًا أكبر في التطبيقات مثل القيادة الذاتية. كما نقترح أيضًا خطة فعالة موزونة على مقياس متعدد (weighted multi-scale scheme) لتقليل العيوب في الخرائط المُتنبّأ بها للعمق. أظهرت التجارب الواسعة على مجموعة بيانات KITTI فعالية النهج المقترحة، حيث حقق النظام الكلي أداءً من الدرجة الأولى في تقدير كل من العمق والحركة الذاتية.