HyperAIHyperAI
منذ 17 أيام

الاستشعار الموجه بالانتباه لتحديد المواقع غير الطبيعية في الصور

Shashanka Venkataramanan, Kuan-Chuan Peng, Rajat Vikram Singh, Abhijit Mahalanobis
الاستشعار الموجه بالانتباه لتحديد المواقع غير الطبيعية في الصور
الملخص

التحديد المكاني للشذوذ هو مشكلة مهمة في الرؤية الحاسوبية، وتتمثل في تحديد المناطق الشاذة داخل الصور، وله تطبيقات واسعة في الفحص الصناعي، والمراقبة، والتصوير الطبي. يُعد هذا المهمة صعبة بسبب حجم العينات الصغير ونطاق التغطية البكسلية للشذوذ في السياقات الواقعية. تعتمد معظم الدراسات السابقة على استخدام صور تدريب شاذة لحساب حدّ محدد لكل فئة لتحديد الشذوذ. وبلا الحاجة إلى صور تدريب شاذة، نقترح نموذجًا يُسمى "مُعدِّل التشفير التلقائي التبايني التبادلي ذي الانتباه الموجه" (CAVGA)، الذي يحدد الشذوذ باستخدام متغير خطي مُتَقَنٍ (convolutional latent variable) للحفاظ على المعلومات المكانية. في البيئة غير المُشرَّفة، نقترح خسارة تمدد الانتباه (attention expansion loss)، حيث نشجع نموذج CAVGA على التركيز على جميع المناطق الطبيعية في الصورة. علاوةً على ذلك، في البيئة شبه المُشرَّفة، نقترح خسارة الانتباه الموجهة المكملة (complementary guided attention loss)، حيث نشجع خريطة الانتباه على التركيز على جميع المناطق الطبيعية في الوقت الذي نقلل فيه من تركيزها على المناطق الشاذة. يتفوق نموذج CAVGA على أحدث الطرق المُتفوقة (SOTA) في تحديد الشذوذ على مجموعات بيانات MVTec Anomaly Detection (MVTAD)، وShanghaiTech Campus المُعدَّلة (mSTC)، وLarge-scale Attention based Glaucoma (LAG) في البيئة غير المُشرَّفة، وكذلك عند استخدام 2% فقط من الصور الشاذة في البيئة شبه المُشرَّفة. كما يتفوق CAVGA على الطرق المُتفوقة في كشف الشذوذ على مجموعات بيانات MNIST، CIFAR-10، Fashion-MNIST، MVTAD، mSTC، وLAG.

الاستشعار الموجه بالانتباه لتحديد المواقع غير الطبيعية في الصور | أحدث الأوراق البحثية | HyperAI