PiCANet: تعلم الانتباه السياقي على مستوى البكسل لاكتشاف الأهمية

تلعب السياقات دورًا مهمًا في مهمة اكتشاف البارزة. ومع ذلك، فإن ليس كل المعلومات السياقية المقدمة في منطقة سياق معينة مفيدة للمهمة النهائية. في هذا البحث، نقترح شبكة انتباه سياقي على مستوى البكسل جديدة، وهي شبكة PiCANet، لتعلم التركيز بشكل منتقى على مواقع السياق المعلوماتية لكل بكسل. بتحديد أكثر، يمكن لكل بكسل أن يولد خريطة انتباه حيث يتوافق كل وزن انتباه مع الصلة السياقية في كل موقع سياقي. ثم يمكن بناء ميزة سياقية محملة بالانتباه من خلال تجميع المعلومات السياقية بشكل منتقٍ. نصيغ الشبكة المقترحة PiCANet في أشكال عالمية ومحليّة للتركيز على السياقات العالمية والمحلية على التوالي. كلا النموذجين قابلين للتفاضل الكامل ويمكن دمجهما في شبكات CNN للتدريب المشترك. كما ندمج النماذج المقترحة مع هيكل U-Net لاكتشاف الأشياء البارزة. تظهر التجارب الواسعة أن الشبكات المقترحة PiCANet يمكنها تحسين أداء اكتشاف البارزة بشكل مستمر. تساعد الشبكات العالمية والمحلية PiCANet على تعلم التباين العالمي والتجانس المحلي على التوالي. نتيجة لذلك، يمكن لنموذج البارزة لدينا أن يكتشف الأشياء البارزة بدقة وأكثر تناسقًا، مما يجعل أدائه متفوقًا على أفضل الأساليب الحالية (state-of-the-art).