HyperAIHyperAI
منذ 2 أشهر

تعلم الإجابة على الأسئلة البصرية من خلال تطبيق الانتباه الصعب بطريقة التمهيد الذاتي

Mateusz Malinowski; Carl Doersch; Adam Santoro; Peter Battaglia
تعلم الإجابة على الأسئلة البصرية من خلال تطبيق الانتباه الصعب بطريقة التمهيد الذاتي
الملخص

يُعتقد أن آليات الانتباه في الإدراك البيولوجي تختار مجموعات فرعية من المعلومات الإدراكية لمعالجتها بطرق أكثر تعقيدًا، وهو ما سيكون مكلفًا جدًا إذا تم تنفيذه على جميع المدخلات الحسية. ومع ذلك، في مجال الرؤية الحاسوبية، لم يتم استكشاف الانتباه القاسي (حيث يتم تجاهل بعض المعلومات بشكل انتقائي) بشكل كبير، رغم نجاح الانتباه اللين (حيث يتم إعادة وزن المعلومات وتجميعها ولكن لا يتم ترشيحها).في هذا البحث، نقدم نهجًا جديدًا للانتباه القاسي ونجده يحقق أداءً تنافسيًا للغاية على مجموعات بيانات الأسئلة والإجابات البصرية التي تم إصدارها مؤخرًا، حيث يساوي ويتفوق في بعض الحالات على هياكل الانتباه اللين المماثلة بينما يتجاهل بعض الخصائص تمامًا. وحتى لو كان يُعتقد أن آلية الانتباه القاسي غير قابلة للمفاضلة، فقد وجدنا أن حجم الخصائص يرتبط بالصلة الدلالية ويقدم إشارة مفيدة لمعيار اختيار انتباه آلية الانتباه لدينا.نظرًا لأن الانتباه القاسي يختار الخصائص الهامة لمعلومات الإدخال، يمكن أن يكون أكثر كفاءة من آليات الانتباه اللين المماثلة. وهذا مهم بشكل خاص بالنسبة للنهج الحديثة التي تستعمل عمليات زوجية غير محلية، حيث تكون تكاليف الحساب والذاكرة مربعة حسب حجم مجموعة الخصائص.

تعلم الإجابة على الأسئلة البصرية من خلال تطبيق الانتباه الصعب بطريقة التمهيد الذاتي | أحدث الأوراق البحثية | HyperAI