HyperAIHyperAI

Command Palette

Search for a command to run...

SWAGAN: نموذج توليدي مُحَفّز بالنمط يعتمد على الموجات الصغيرة

Rinon Gal Dana Cohen Amit Bermano Daniel Cohen-Or

الملخص

في السنوات الأخيرة، تم إحراز تقدم كبير في الجودة البصرية لشبكات التوليد التنافسية (GANs). ومع ذلك، تظل هذه الشبكات تعاني من تدهور في الجودة عند التعامل مع المحتوى عالي التردد، ناتجًا عن هيكلية متحيزة طيفيًا، بالإضافة إلى دوال خسارة غير مواتية بشكل مشابه. لمعالجة هذه المشكلة، نقدّم نموذجًا جديدًا عامًا يُسمى "ستايل ويفلت بيسد جان" (SWAGAN)، الذي يُطبّق التوليد التدريجي في المجال الترددي. يدمج SWAGAN موجات الموجات (wavelets) في هيكل المُولّد والمُميّز، مما يفرض تمثيلًا للمساحة الخلفية يراعي التردد في كل خطوة من خطوات التوليد. يؤدي هذا النهج إلى تحسينات ملحوظة في الجودة البصرية للصور المولّدة، كما يزيد بشكل كبير من الأداء الحسابي. نُظهر فائدة منهجنا من خلال دمجه في إطار StyleGAN2، ونُثبت أن توليد المحتوى في المجال الموجي يؤدي إلى صور ذات جودة أعلى، مع محتوى عالي التردد أكثر واقعية. علاوةً على ذلك، نُثبت أن فضاء المُدخلات (المساحة الخلفية) في نموذجنا يحتفظ بالخصائص التي تجعل StyleGAN أساسًا مناسبًا لسلسلة من مهام التحرير، ونُظهر أن نهجنا المُراعي للتردد يُسهم أيضًا في تحسين الجودة البصرية في المهام اللاحقة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp