HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة التفاعل الواعية بالسياق لتقسيم الدلالة في صور RGB-T

Ying Lv Xiaoyu Chen Zhiwei Guo Jianhong Zhang

الملخص

التفصيل الدلالي RGB-T هو تقنية أساسية لفهم مشاهد القيادة الذاتية. ومع ذلك، فإن استكشاف العلاقة التكميلية الفعالة بين الوسائط المختلفة لم يتم تنفيذه في التفاعل المعلوماتي بين المستويات المتعددة في طرق التفصيل الدلالي RGB-T الحالية. لمعالجة هذه المشكلة، تم اقتراح شبكة التفاعل الواعي بالسياق (CAINet) للتفصيل الدلالي RGB-T، والتي تبني فضاءً للتفاعل لاستخدام المهام المساعدة والسياق العالمي لتحقيق التعلم المنظم بشكل صريح. بصفة خاصة، نقترح وحدة الاستدلال التكميلي الواعي بالسياق (CACR) بهدف إنشاء العلاقة التكميلية بين ميزات الوسائط المتعددة مع السياق طويل الأمد في الأبعاد المكانية والقنوات. بالإضافة إلى ذلك، وفي ضوء أهمية السياق العالمي والمعلومات التفصيلية، نقترح وحدة نمذجة السياق العالمي (GCM) ووحدة تجميع التفاصيل (DA)، ونقدم إشرافًا مساعدًا محددًا لتنظيم التفاعل السياقي بشكل صريح وتكرار خريطة التقسيم. أظهرت التجارب الشاملة على قاعدتي بيانات معياريتين هما MFNet وPST900 أن الشبكة المقترحة CAINet حققت أداءً يتفوق على أفضل ما سبقه. يمكن الحصول على الكود من الرابط: https://github.com/YingLv1106/CAINet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp