HyperAIHyperAI
منذ 17 أيام

النماذج المتسلسلة للانتشار لتكوين صور عالية الدقة

Jonathan Ho, Chitwan Saharia, William Chan, David J. Fleet, Mohammad Norouzi, Tim Salimans
النماذج المتسلسلة للانتشار لتكوين صور عالية الدقة
الملخص

نُظهر أن النماذج التبادلية للانتشار قادرة على إنتاج صور عالية الوضوح في معيار توليد ImageNet الشرطي بالفئة، دون الحاجة إلى أي مساعدة من تصنيفات صور مساعدة لتحسين جودة العينات. تتكوّن النموذج التبادلي للانتشار من سلسلة متتالية من نماذج الانتشار التي تُولّد صورًا بحلّة متزايدة، بدءًا بنموذج انتشار قياسي على أدنى دقة، يليه واحد أو أكثر من نماذج الانتشار ذات التحسين التفاصيلي (super-resolution) التي تقوم بالتسلسل بزيادة دقة الصورة وإضافة تفاصيل بدقة أعلى. وجدنا أن جودة العينات في النموذج التبادلي تعتمد بشكل حاسم على تحسين التحديد (conditioning augmentation)، وهي الطريقة التي اقترحناها لتوسيع بيانات الإدخال المُحدَّدة على دقة منخفضة المُقدّمة إلى نماذج التحسين التفاصيلي. تُظهر تجاربنا أن تحسين التحديد يمنع تراكم الأخطاء أثناء عملية التوليد في النموذج التبادلي، مما يساعدنا على تدريب سلاسل تبادلية تحقق درجات FID قدرها 1.48 عند دقة 64×64، و3.52 عند 128×128، و4.88 عند 256×256، متفوّقةً على BigGAN-deep، كما تحقق درجات دقة تصنيف قدرها 63.02% (المرتبة الأولى) و84.06% (المرتبة الخامسة) عند دقة 256×256، متفوّقةً على VQ-VAE-2.