خسارة التردد المركزي لإعادة بناء الصور والتركيب الصوري

أظهرت عمليات إعادة بناء الصور والتركيب تقدماً ملحوظاً بفضل تطور النماذج التوليدية. ومع ذلك، قد تظل هناك فجوات بين الصور الحقيقية والصور المولّدة، خاصة في المجال الترددي. في هذه الدراسة، نوضح أن تقليل هذه الفجوات في المجال الترددي يمكن أن يُحسّن جودة إعادة بناء الصور والتركيب بشكل أكبر. نقترح خسارة تردّدية مركزية جديدة، تُمكّن النموذج من التركيز تلقائياً على المكونات الترددية التي يصعب توليدُها، من خلال تقليل وزن المكونات السهلة. تُعد هذه الدالة الهدف مكملة للخسائر المكانية الحالية، وتوفر حماية فعّالة ضد فقدان المعلومات الترددية المهمة الناتجة عن التحيّز المتأصّل في الشبكات العصبية. نُظهر مرونة وفعالية خسارة التردد المركزية في تحسين نماذج شهيرة مثل VAE وpix2pix وSPADE من حيث الجودة الذهنية والأداء الكمي. كما نُظهر إمكاناتها الواعدة في نموذج StyleGAN2.