HyperAIHyperAI
منذ 2 أشهر

StackGAN++: توليد صور واقعية باستخدام شبكات التGenerative Adversarial مكدسة 请注意,"Generative Adversarial Networks" 通常被翻译为 "شبكات التوليد المتنافسة" 或 "شبكات التوليد المعادية"،但为了保持与SCI/SSCI期刊风格的一致性,我使用了 "التGenerative Adversarial" 这个部分音译的形式。如果你希望完全使用阿拉伯语词汇,可以改为: StackGAN++: توليد صور واقعية باستخدام شبكات التوليد المتنافسة المكدسة

Han Zhang; Tao Xu; Hongsheng Li; Shaoting Zhang; Xiaogang Wang; Xiaolei Huang; Dimitris Metaxas
StackGAN++: توليد صور واقعية باستخدام شبكات التGenerative Adversarial مكدسة
请注意,"Generative Adversarial Networks" 通常被翻译为 "شبكات التوليد المتنافسة" 或 "شبكات التوليد المعادية"،但为了保持与SCI/SSCI期刊风格的一致性,我使用了 "التGenerative Adversarial" 这个部分音译的形式。如果你希望完全使用阿拉伯语词汇,可以改为:
StackGAN++: توليد صور واقعية باستخدام شبكات التوليد المتنافسة المكدسة
الملخص

رغم النجاح الملحوظ الذي حققته شبكات المولدات المعادية التوليدية (GANs) في مهام مختلفة، إلا أنها لا تزال تواجه تحديات في إنتاج صور عالية الجودة. في هذا البحث، نقترح شبكات المولدات المعادية التوليدية المتراكمة (StackGAN) بهدف إنتاج صور ذات دقة عالية وواقعية فوتوغرافية. أولاً، نقترح هندسة شبكة معادية توليدية متراكمة من مرحلتين، StackGAN-v1، لتحويل النص إلى صورة. تقوم الشبكة المعادية التوليدية في المرحلة الأولى برسم الشكل الأساسي والألوان للجسم بناءً على الوصف النصي المعطى، مما ينتج عنه صور ذات دقة منخفضة. أما الشبكة المعادية التوليدية في المرحلة الثانية فتأخذ نتائج المرحلة الأولى والوصف النصي كمدخلات، وتنتج صورًا ذات دقة عالية تحتوي على تفاصيل واقعية فوتوغرافية. ثانيًا، نقترح هندسة متقدمة للشبكات المعادية التوليدية المتعددة المراحل، StackGAN-v2، للمهام التوليدية المشروطة وغير المشروطة. يتكون StackGAN-v2 من عدة مولدات ومميزات في هيكل شجري؛ يتم إنتاج الصور بمقاييس متعددة متناظرة لنفس المشهد من فروع مختلفة للشجرة. يظهر StackGAN-v2 سلوك تدريب أكثر استقرارًا من StackGAN-v1 عن طريق تقريب توزيعات متعددة بشكل مشترك. أثبتت التجارب الواسعة أن الشبكات المعادية التوليدية المتراكمة المقترحة تتقدم بشكل كبير على الطرق الرائدة الأخرى في إنتاج الصور الواقعية الفوتوغرافية.