DIDFuse: التفكيك العميق للصورة لدمج الصور تحت الحمراء والصورة المرئية

الاندماج بين الصور تحت الحمراء والصور المرئية، وهو موضوع مثير للانتباه في مجال معالجة الصور، يهدف إلى الحصول على صور مدمجة تحافظ على المزايا المتميزة للصور المصدرية. تقدم هذه الورقة شبكة تعلم تلقائي (AE) جديدة لعملية الاندماج. الفكرة الأساسية تتمثل في أن المُشفّر يقوم بتفكيك الصورة إلى خريطة ميزات خلفية وخرائط ميزات تفاصيل، حيث تمثل هذه الخرائط المعلومات ذات التردد المنخفض والتردد العالي على التوالي، بينما يقوم المُفكّك بإعادة بناء الصورة الأصلية. ولتحقيق ذلك، يتم تعريف دالة الخسارة بحيث تجعل خرائط الميزات الخلفية للمصادر متشابهة، بينما تجعل خرائط الميزات التفصيلية غير متشابهة. في مرحلة الاختبار، يتم دمج خرائط الميزات الخلفية والتفصيلية بشكل منفصل من خلال وحدة اندماج، ثم تُستعاد الصورة المدمجة بواسطة المُفكّك. تُظهر النتائج الكمية والكيفية أن الطريقة المقترحة قادرة على إنتاج صور مدمجة تحتوي على أهداف بارزة ومعلومات تفصيلية غنية بالبنية النسيجية، مع قدرة قوية على التحمل، وتفوق في الوقت نفسه الطرق المتطورة الحالية (SOTA).