HyperAIHyperAI
منذ 17 أيام

SWAGAN: نموذج توليدي مُحَفّز بالنمط يعتمد على الموجات الصغيرة

Rinon Gal, Dana Cohen, Amit Bermano, Daniel Cohen-Or
SWAGAN: نموذج توليدي مُحَفّز بالنمط يعتمد على الموجات الصغيرة
الملخص

في السنوات الأخيرة، تم إحراز تقدم كبير في الجودة البصرية لشبكات التوليد التنافسية (GANs). ومع ذلك، تظل هذه الشبكات تعاني من تدهور في الجودة عند التعامل مع المحتوى عالي التردد، ناتجًا عن هيكلية متحيزة طيفيًا، بالإضافة إلى دوال خسارة غير مواتية بشكل مشابه. لمعالجة هذه المشكلة، نقدّم نموذجًا جديدًا عامًا يُسمى "ستايل ويفلت بيسد جان" (SWAGAN)، الذي يُطبّق التوليد التدريجي في المجال الترددي. يدمج SWAGAN موجات الموجات (wavelets) في هيكل المُولّد والمُميّز، مما يفرض تمثيلًا للمساحة الخلفية يراعي التردد في كل خطوة من خطوات التوليد. يؤدي هذا النهج إلى تحسينات ملحوظة في الجودة البصرية للصور المولّدة، كما يزيد بشكل كبير من الأداء الحسابي. نُظهر فائدة منهجنا من خلال دمجه في إطار StyleGAN2، ونُثبت أن توليد المحتوى في المجال الموجي يؤدي إلى صور ذات جودة أعلى، مع محتوى عالي التردد أكثر واقعية. علاوةً على ذلك، نُثبت أن فضاء المُدخلات (المساحة الخلفية) في نموذجنا يحتفظ بالخصائص التي تجعل StyleGAN أساسًا مناسبًا لسلسلة من مهام التحرير، ونُظهر أن نهجنا المُراعي للتردد يُسهم أيضًا في تحسين الجودة البصرية في المهام اللاحقة.