HyperAIHyperAI
منذ 17 أيام

TriStereoNet: إطار ثلاثي العدسات لتقدير التباين متعدد القواعد

Faranak Shamsafar, Andreas Zell
TriStereoNet: إطار ثلاثي العدسات لتقدير التباين متعدد القواعد
الملخص

الرؤية الثلاثية هي تقنية فعّالة لتقدير العمق، وتُطبَّق على نطاق واسع في القيادة ذاتية التحكم في البيئات الحضرية والطرق السريعة. وعلى الرغم من تطور العديد من النماذج القائمة على التعلم العميق للرؤية الثنائية، إلا أن البيانات المدخلة من تكوين ثنائي العين بمسافة ثابتة محدودة. ولحل هذه المشكلة، نقدّم شبكة من النهاية إلى النهاية لمعالجة البيانات الناتجة عن تكوين ثلاثي العين، والذي يتكوّن من زوجين ثنائيي العين: أحدهما ضيق والآخر واسع. في هذا التصميم، يتم معالجة زوجين من البيانات الثنائية التي تشترك في صورة مرجعية واحدة باستخدام أوزان مشتركة للشبكة ودمج على مستوى متوسط. كما نقترح طريقة "الإضافة المُرشَّدة" لدمج البيانات ذات الأبعاد الأربعة (4D) الناتجة عن المسافتين المختلفتين. بالإضافة إلى ذلك، نقدّم نموذجًا تدريبيًا تسلسليًا تلقائيًا يجمع بين التعلم المُرشَّد وغير المُرشَّد، باستخدام بيانات حقيقية وبيانات مُحاكاة، مما يجعل تدريب النظام الثلاثي عمليًا دون الحاجة إلى بيانات حقيقية مُعلّمة مسبقًا. تُظهر النتائج التجريبية أن شبكة التباين الثلاثية تتفوّق على السيناريو الذي يتم فيه إدخال كل زوج ثنائي على حدة إلى بنية مماثلة. الكود والبيانات: https://github.com/cogsys-tuebingen/tristereonet.

TriStereoNet: إطار ثلاثي العدسات لتقدير التباين متعدد القواعد | أحدث الأوراق البحثية | HyperAI