HyperAIHyperAI

Command Palette

Search for a command to run...

HiMODE: نموذج هجين لتقدير العمق من منظور مفرد أومنيديريكتي

Masum Shah Junayed Arezoo Sadeghzadeh Md Baharul Islam Lai-Kuan Wong Tarkan Aydin

الملخص

تحظى التقديرات العميقة الأحادية الاتجاهية الشاملة باهتمام بحثي كبير نظرًا لتطبيقاتها الواسعة في استشعار البيئة المحيطة بزاوية 360 درجة. تعاني الطرق الحالية في هذا المجال من قيود تتعلق بإعادة استرجاع تفاصيل الأشياء الصغيرة، وفقدان البيانات أثناء عملية جمع خرائط العمق الحقيقية (ground-truth). في هذا البحث، نقترح نموذجًا جديدًا لتقدير العمق الأحادي الاتجاهي الشامل يُسمى HiMODE، والذي يعتمد على بنية هجينة من الشبكة العصبية التلافيفية (CNN) وشبكة Transformer (مُشفِّر-مُفكِّك)، حيث تم تصميم وحداتها بشكل فعّال لتقليل التشوهات وتكاليف الحساب، دون التضحية بالأداء. أولاً، نصمم شبكة هرمية للسمات تعتمد على كتلة HNet لاستخراج سمات عالية الدقة بالقرب من الحواف. ويُحسَّن الأداء بشكل إضافي بفضل طبقة الانتباه الذاتي والمتداخل (self and cross attention) ووحدات المساحة/الزمن (spatial/temporal patches) في مُشفِّر ومُفكِّك Transformer على التوالي. بالإضافة إلى ذلك، تُستخدم وحدة متبقيات مساحية (spatial residual block) لتقليل عدد المعلمات. من خلال تمرير السمات العميقة المستخرجة من الصورة المدخلة عبر كل كتلة أساسية في الشبكة، إلى جانب خرائط العمق الأولية التي يُقدِّمها مُشفِّر-مُفكِّك Transformer، عبر طبقة تعديل السياق (context adjustment layer)، يمكن للنموذج إنتاج خرائط عمق ناتجة تتفوق في الجودة البصرية على خرائط العمق الحقيقية. أظهرت دراسات التحليل التفصيلي الشاملة أهمية كل وحدة منفصلة. وتم إجراء تجارب واسعة على ثلاث مجموعات بيانات: Stanford3D، Matterport3D، وSunCG، وأظهرت النتائج أن HiMODE يمكنه تحقيق أداءً رائدًا في مجال تقدير العمق الأحادي الاتجاهي بزاوية 360 درجة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp