HyperAIHyperAI
منذ 17 أيام

تجاوز حد النافذة المحلية: تحويلة تحسين دقيق متقدمة مع قاموس رموز تكيفي

Leheng Zhang, Yawei Li, Xingyu Zhou, Xiaorui Zhao, Shuhang Gu
تجاوز حد النافذة المحلية: تحويلة تحسين دقيق متقدمة مع قاموس رموز تكيفي
الملخص

يُعدّ تحسين دقة الصورة الفردية (Single Image Super-Resolution) أحد المشكلات الكلاسيكية في رؤية الحاسوب، ويتضمن تقدير صور عالية الدقة (HR) من صور منخفضة الدقة (LR). وعلى الرغم من التقدم الكبير الذي شهده الشبكات العصبية العميقة (DNNs)، وخاصة نماذج المُحوّل (Transformers) في مجال التحسين، تظل هناك تحديات قائمة، وبخاصة في الحدود المحدودة للحقل الاستقبالي الناتجة عن آلية الانتباه الذاتي القائمة على النوافذ. ولحل هذه المشكلات، نقدّم مجموعة من القواميس التلقائية للرموز (Adaptive Token Dictionary) كمُساعدة لشبكة المُحوّل الخاصة بتحسين الدقة، ونُقدّم طريقة تُسمى ATD-SR. يمكن للقواميس الرمزية المُقدّمة أن تتعلم معلومات سابقة من بيانات التدريب، ثم تُعدّل هذه المعلومات السابقة المُكتسبة بما يتناسب مع الصورة المُختبرة المحددة من خلال خطوة تحسين تلقائية. وتُوفّر استراتيجية التحسين هذه ليس فقط معلومات عالمية لجميع الرموز المدخلة، بل تُجمّع أيضًا رموز الصورة إلى فئات. وباستنادًا إلى تقسيم هذه الفئات، نقترح آلية انتباه ذاتي قائمة على الفئة، مصممة لاستغلال الرموز البعيدة ولكن المتشابهة لتعزيز سمات الإدخال. وتشير النتائج التجريبية إلى أن طريقتنا تحقق أفضل أداء على مجموعة متنوعة من معايير تحسين دقة الصورة الفردية.