UniFuse: دمج أحادي الاتجاه لتقدير عمق المنظور 360 درجة

يُعدّ استخلاص العمق من الصور المحيطية الكروية موضوعًا بحثيًا شائعًا بشكل متزايد، نظرًا لأن الصورة المحيطية توفر مجال رؤية كاملًا للبيئة وتوفر وصفًا نسبيًا شاملاً للمشهد. ومع ذلك، فإن تطبيق الشبكات العصبية التلافيفية (CNNs) المُدرّسة جيدًا على الصور المنظورية على التمثيل القياسي للصور المحيطية الكروية، أي التمثيل المتساوي الطول (equirectangular projection)، ليس الأمثل، حيث تزداد التشوهات نحو القطبين. أما التمثيل الآخر فهو التمثيل المكعب (cubemap projection)، الذي يخلو من التشوهات ولكنه ينقطع عند الحواف ويقتصر على مجال رؤية محدود. يقدّم هذا البحث إطارًا جديدًا لدمج الميزات من كلا التمثيلين، حيث يتم تغذية ميزات التمثيل المكعب إلى ميزات التمثيل المتساوي الطول بشكل أحادي الاتجاه فقط في مرحلة التفكيك (decoding). على عكس النهج الحديث للدمج المزدوج (bidirectional fusion) الذي يعمل في كل من مرحلتي التشفير (encoding) والتفكيك، فإن نهجنا للدمج أكثر كفاءة بكثير. علاوةً على ذلك، قمنا بتصميم وحدة دمج أكثر فعالية تناسب نهجنا. تؤكد التجارب فعالية الاستراتيجية والوحدة المُقترحة، ويحقق نموذجنا أداءً متقدمًا على أربع مجموعات بيانات شهيرة. كما تُظهر تجارب إضافية أن نموذجنا يتمتع بمزايا في تعقيد النموذج وقدرته على التعميم. يمكن الوصول إلى الكود من خلال الرابط التالي: https://github.com/alibaba/UniFuse-Unidirectional-Fusion.