HyperAIHyperAI
منذ 3 أشهر

اتساق واعٍ على مقياس متعدد الوسائط لتقدير العمق التلقائي من منظور واحد

Hemang Chawla, Arnav Varma, Elahe Arani, Bahram Zonooz
اتساق واعٍ على مقياس متعدد الوسائط لتقدير العمق التلقائي من منظور واحد
الملخص

يُعد التقدير الكثيف للعمق ضروريًا لفهم المشهد في أنظمة القيادة الذاتية. ومع ذلك، تعاني الطرق الحديثة ذاتية التدريب المبنية على مقاطع فيديو أحادية العدسة من مشكلة عدم اتساق المقياس على طول التسلسلات الطويلة. لمعالجة هذه التحديات، نستخدم بيانات من أنظمة الملاحة العالمية (GPS) التي تكون متاحة بشكل واسع، من خلال اقتراح خسارة ديناميكية تُسمى "GPS إلى مقياس" (g2s) لتعزيز الخسائر القائمة على المظهر. نشدد على أن نظام GPS مطلوب فقط أثناء التدريب متعدد الوسائط، وليس أثناء الاستنتاج. توفر المسافة النسبية بين الإطارات المُسجّلة عبر نظام GPS إشارة مقياس مستقلة عن إعدادات الكاميرا وتوزيع المشهد، مما يؤدي إلى تمثيلات مميزة أكثر ثراءً في الميزات المُتعلّمة. من خلال تقييم واسع النطاق على عدة مجموعات بيانات، نُظهر تقديرًا عميقًا متسقًا ومُدركًا للمقياس أثناء الاستنتاج، مع تحسين الأداء حتى عند التدريب باستخدام بيانات GPS منخفضة التردد.