HyperAIHyperAI
منذ 17 أيام

TranSalNet: نحو توقع الانتباه البصري ذي الصلة الإدراكية

Jianxun Lou, Hanhe Lin, David Marshall, Dietmar Saupe, Hantao Liu
TranSalNet: نحو توقع الانتباه البصري ذي الصلة الإدراكية
الملخص

تنبؤ بالجاذبية البصرية باستخدام المحولات (Transformers) – لقد ساهمت الشبكات العصبية التلافيفية (CNNs) بشكل كبير في تطوير النماذج الحاسوبية للتنبؤ بالجاذبية البصرية. ومع ذلك، لا يزال التمثيل الدقيق للآليات المرتبطة بالانتباه البصري في القشرة الدماغية البشرية تحدياً أكاديمياً. ومن الضروري دمج خصائص الرؤية البشرية في تصميم هياكل الشبكات العصبية التلافيفية، مما يؤدي إلى نماذج تنبؤ بالجاذبية تكون أكثر ارتباطاً بالتمييز البصري. وبسبب التحيزات الاستنتاجية المتأصلة في هياكل الشبكات التلافيفية، تفتقر هذه الهياكل إلى قدرة كافية على ترميز السياق على المدى الطويل، ما يعيق نماذج الجاذبية المستندة إلى الشبكات التلافيفية من التقاط الخصائص التي تمثل سلوك المشاهدة البشري. وقد أظهرت المحولات (Transformers) إمكانات كبيرة في ترميز المعلومات على المدى الطويل من خلال الاستفادة من آلية الانتباه الذاتي (self-attention). في هذا البحث، نقترح نموذجاً جديداً للجاذبية يدمج مكونات المحولات مع الشبكات التلافيفية بهدف التقاط المعلومات البصرية السياقية على المدى الطويل. وأظهرت النتائج التجريبية أن المحولات تضيف قيمة مضافة للتنبؤ بالجاذبية، مما يعزز من دقة التنبؤ من حيث الارتباط البصري. وقد حقق النموذج المقترح للجاذبية باستخدام المحولات أداءً متفوقاً على المعايير العامة والمسابقات المتاحة لنماذج التنبؤ بالجاذبية.كود المصدر للنموذج المقترح TranSalNet متوفر عبر الرابط التالي: https://github.com/LJOVO/TranSalNet