تعلم نواة عالمية الوعي للتناغم الصوري

يهدف توحيد الصور إلى حل مشكلة عدم التناسق البصري في الصور المركبة من خلال ضبط بكسلات المقدمة بشكل متكيف مع الخلفية كمرجع. تعتمد الطرق الحالية على تحويل اللون المحلي أو التوافق بين المناطق في المقدمة والخلفية، مما يتجاهل القرب القوي كمبدأ أولي ويقوم بتمييز المقدمة والخلفية بشكل مستقل كجزء كامل للتوحيد. نتيجة لذلك، لا تزال هذه الطرق تظهر أداءً محدودًا عند التعامل مع كائنات مقدمة متنوعة ومشاهد مختلفة. لحل هذه المشكلة، نقترح شبكة نواة عالمية جديدة (GKNet) لتوحيد المناطق المحلية مع الأخذ في الاعتبار الشامل للمرجعيات البعيدة للخلفية.تحتوي GKNet على جزأين رئيسيين، وهما: فرع التنبؤ بالنواة الموحدة وفرع تعديل النواة الموحدة. يتضمن الجزء الأول مستخرج السياق البعيد (LRE) للحصول على سياق بعيد، وكتل التنبؤ بالنواة (KPB) لتنبؤ النوى الموحدة متعددة المستويات من خلال دمج المعلومات العالمية بالخصائص المحلية. لتحقيق هذا الهدف، تم اقتراح وحدة الاندماج المرتبط بالاختيار (SCF) جديدة لاختيار أفضل المرجعيات البعيدة ذات الصلة للتوحيد المحلي. يستخدم الجزء الثاني النوى المتوقعة لتوحيد مناطق المقدمة مع الوعي المحلي والعالمي.أثبتت التجارب العديدة تفوق طريقة GKNet في توحيد الصور على أفضل الأساليب الحالية، مثل تحقيق نسبة إشارة إلى الضوضاء (PSNR) قدرها 39.53 ديسيبل التي تتفوق على أفضل الأطراف المنافسة بمقدار +0.78 ديسيبل ↑؛ وتقليل الخطأ المتوسط الكسري/الخطأ المتوسط (fMSE/MSE) بنسبة 11.5٪ ↓ / 6.7٪ ↓ مقارنة بأفضل طريقة حالية. سيتم توفير الكود في الرابط التالي: \href{https://github.com/XintianShen/GKNet}{هنا}.