HyperAIHyperAI
منذ 2 أشهر

نحو تقدير عمق متين باستخدام الكاميرا单车眼: خلط مجموعة بيانات للنقل بين مجموعات البيانات بدون تصوير

René Ranftl; Katrin Lasinger; David Hafner; Konrad Schindler; Vladlen Koltun
نحو تقدير عمق متين باستخدام الكاميرا单车眼: خلط مجموعة بيانات للنقل بين مجموعات البيانات بدون تصوير
الملخص

يعتمد نجاح تقدير العمق الأحادي العين على مجموعات تدريب كبيرة ومتنوعة. نظرًا للتحديات المرتبطة بجمع بيانات العمق الحقيقية الكثيفة في بيئات مختلفة وبمقياس كبير، ظهرت عدة قواعد بيانات ذات خصائص وتحيزات مميزة. نطور أدوات تتيح خلط العديد من قواعد البيانات أثناء التدريب، حتى لو كانت تسمياتها غير متوافقة. بشكل خاص، نقترح هدف تدريب متين لا يتأثر بالتغييرات في نطاق العمق والمقياس، وندعو إلى استخدام التعلم متعدد الأهداف المبدئي لدمج البيانات من مصادر مختلفة، ونؤكد أهمية التدريب الأولي للمشفرات على المهام المساعدة. باستخدام هذه الأدوات، نجري تجارب على خمسة مجموعات تدريب متنوعة، بما في ذلك مصدر بيانات ضخم جديد: الأفلام ثلاثية الأبعاد (3D films). لبيان قوة التعميم لنهجنا، نستخدم النقل عبر قواعد البيانات دون الحاجة إلى إعادة التدريب (zero-shot cross-dataset transfer)، أي أننا نقيم أداء النموذج على قواعد بيانات لم يتم رؤيتها أثناء التدريب. تؤكد التجارب أن خلط البيانات من المصادر المكملة يحسن تقدير العمق الأحادي العين بشكل كبير. يتفوق نهجنا بوضوح على الطرق المنافسة عبر مجموعة متنوعة من قواعد البيانات، مما يجعله يحدد مستوى جديدًا للتقنية الحالية في تقدير العمق الأحادي العين. يمكن مشاهدة بعض النتائج في الفيديو الإضافي الموجود على الرابط https://youtu.be/D46FzVyL9I8.

نحو تقدير عمق متين باستخدام الكاميرا单车眼: خلط مجموعة بيانات للنقل بين مجموعات البيانات بدون تصوير | أحدث الأوراق البحثية | HyperAI