HyperAIHyperAI

Command Palette

Search for a command to run...

TriStereoNet: إطار ثلاثي العدسات لتقدير التباين متعدد القواعد

Faranak Shamsafar Andreas Zell

الملخص

الرؤية الثلاثية هي تقنية فعّالة لتقدير العمق، وتُطبَّق على نطاق واسع في القيادة ذاتية التحكم في البيئات الحضرية والطرق السريعة. وعلى الرغم من تطور العديد من النماذج القائمة على التعلم العميق للرؤية الثنائية، إلا أن البيانات المدخلة من تكوين ثنائي العين بمسافة ثابتة محدودة. ولحل هذه المشكلة، نقدّم شبكة من النهاية إلى النهاية لمعالجة البيانات الناتجة عن تكوين ثلاثي العين، والذي يتكوّن من زوجين ثنائيي العين: أحدهما ضيق والآخر واسع. في هذا التصميم، يتم معالجة زوجين من البيانات الثنائية التي تشترك في صورة مرجعية واحدة باستخدام أوزان مشتركة للشبكة ودمج على مستوى متوسط. كما نقترح طريقة "الإضافة المُرشَّدة" لدمج البيانات ذات الأبعاد الأربعة (4D) الناتجة عن المسافتين المختلفتين. بالإضافة إلى ذلك، نقدّم نموذجًا تدريبيًا تسلسليًا تلقائيًا يجمع بين التعلم المُرشَّد وغير المُرشَّد، باستخدام بيانات حقيقية وبيانات مُحاكاة، مما يجعل تدريب النظام الثلاثي عمليًا دون الحاجة إلى بيانات حقيقية مُعلّمة مسبقًا. تُظهر النتائج التجريبية أن شبكة التباين الثلاثية تتفوّق على السيناريو الذي يتم فيه إدخال كل زوج ثنائي على حدة إلى بنية مماثلة. الكود والبيانات: https://github.com/cogsys-tuebingen/tristereonet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TriStereoNet: إطار ثلاثي العدسات لتقدير التباين متعدد القواعد | مستندات | HyperAI