HyperAIHyperAI

Command Palette

Search for a command to run...

كشف الانتباه RGB-D من خلال التقليل المتسلسل لمعلومات التبادل

Jing Zhang Deng-Ping Fan Yuchao Dai Xin Yu Yiran Zhong Nick Barnes Ling Shao

الملخص

لا تُشجّع النماذج الحالية للكشف عن الاهتمام البصري في الصور RGB-D بشكل صريح على تحقيق تعلم متعدد الأنواع الفعّال بين الصور RGB والبيانات العميقة. في هذا البحث، نقدّم إطارًا جديدًا للتعلم المتسلسل متعدد المراحل من خلال تقليل المعلومات المتبادلة، بهدف "تمثيلًا صريحًا" للمعلومات متعددة الأنواع بين الصورة RGB والبيانات العميقة. بشكل محدد، نقوم أولاً بتحويل ميزات كل نمط إلى متجه ميزات أدنى أبعاد، ثم نستخدم تقليل المعلومات المتبادلة كعامل تنظيم لتقليل التكرار بين الميزات البصرية المستمدة من RGB والميزات الهندسية المستمدة من العمق. بعد ذلك، نُطبّق التعلم المتسلسل متعدد المراحل، مع تطبيق قيد تقليل المعلومات المتبادلة في كل مرحلة من مراحل الشبكة. أظهرت التجارب الواسعة على مجموعات بيانات معيارية للكشف عن الاهتمام البصري RGB-D فعالية الإطار المُقترح. علاوةً على ذلك، ولتعزيز تطور هذا المجال، نقدّم أكبر مجموعة بيانات (بحجم 7 أضعاف مجموعة NJU2K)، تتضمّن 15,625 زوجًا من الصور، مع تسميات عالية الجودة على مستويات متعددة: مضلعات، خطوط رسمية، كائنات، كيانات، وتصنيفات ترتيبية. وباستخدام هذه التسميات الغنية، نُنشئ أربع معايير جديدة ذات قواعد مقارنة قوية، ونلاحظ بعض الظواهر المثيرة للاهتمام، والتي يمكن أن تحفّز تصميم النماذج المستقبلية. يُتاح كود المصدر ومجموعة البيانات عبر الرابط: "https://github.com/JingZhang617/cascaded_rgbd_sod".


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp