تحسين توافق الصورة المركبة باستخدام وحدة الانتباه المفصولةatialmente 注意:在阿拉伯语中,“Spatial-Separated” 应该翻译为 “المفصولة فضائياً”。因此,更准确的翻译是: تحسين توافق الصورة المركبة باستخدام وحدة الانتباه المفصولة فضائياً

التركيب الصوري هو أحد أهم التطبيقات في معالجة الصور. ومع ذلك، فإن عدم التناسق في المظهر بين المنطقة المركبة والخلفية يقلل من جودة الصورة. لذلك، نتناول مشكلة التناسق الصوري: بالنظر إلى صورة مركبة وقناع للمنطقة المركبة، نحاول تناسق "الأسلوب" للمنطقة الملصقة مع الخلفية (المنطقة غير المركبة). كانت الطرق السابقة تركز على التعلم مباشرة بواسطة الشبكة العصبية. في هذا العمل، نبدأ بملاحظة تجريبية: يمكن العثور على الاختلافات فقط في المنطقة المركبة بين الصورة المركبة والنتيجة المنسجمة بينما تشترك في نفس المعلومات الدلالية والمظهر في المنطقة غير المركبة. لذا، من أجل تعلم خريطة الميزات في المنطقة المصونة وغيرها بشكل منفصل، نقترح وحدة انتباه جديدة تُسمى وحدة الانتباه الفراغي المنفصل (Spatial-Separated Attention Module - S2AM). بالإضافة إلى ذلك، نصمم إطارًا جديدًا للتناسق الصوري بإدخال S2AM في الميزات الأولية الخشنة لهيكل Unet بطرق مختلفة اثنتين. بخلاف التناسق الصوري، نخطو خطوة كبيرة نحو تناسق الصورة المركبة دون الحاجة إلى قناع محدد بناءً على الملاحظة السابقة. أظهرت التجارب أن الوحدة المقترحة S2AM تؤدي بشكل أفضل من الوحدات الأخرى الرائدة في مجال الانتباه في مهمتنا. علاوة على ذلك، نوضح مزايا نموذجنا مقابل طرق التناسق الصوري الرائدة الأخرى عبر معايير متعددة. يمكن الحصول على الكود من https://github.com/vinthony/s2am