HyperAIHyperAI
منذ 15 أيام

نماذج التباعد تتفوق على GANs في تصنيع الصور

Prafulla Dhariwal, Alex Nichol
نماذج التباعد تتفوق على GANs في تصنيع الصور
الملخص

نُظهر أن نماذج التشتت يمكنها تحقيق جودة عينات صور تفوق النماذج التوليدية الحالية الأفضل في مجالها. ونحقق ذلك في توليد الصور دون شرط من خلال اكتشاف بنية أفضل من خلال سلسلة من التحليلات التجريمية. أما في حالة التوليد الصوتي الشرطي، فإننا نُحسّن جودة العينات بشكل إضافي باستخدام التوجيه بواسطة الفاصل (classifier guidance): طريقة بسيطة وفعالة من حيث الحوسبة لاستبدال التنوّع بالدقة، باستخدام التدرجات الناتجة عن فاصل. ونحقق مؤشر FID قدره 2.97 على ImageNet بحجم 128×128، و4.59 على ImageNet بحجم 256×256، و7.72 على ImageNet بحجم 512×512، مع التماثل مع BigGAN-deep حتى باستخدام ما لا يقل عن 25 عملية تمرير أمامي لكل عينة، مع الحفاظ على تغطية أفضل لتوزيع البيانات. وأخيرًا، نجد أن التوجيه بواسطة الفاصل يتكامل بشكل جيد مع نماذج التشتت التي تعتمد على التكبير (upsampling diffusion models)، مما يُحسّن مؤشر FID إلى 3.94 على ImageNet بحجم 256×256، و3.85 على ImageNet بحجم 512×512. ونُطلق رمزنا البرمجي عبر الرابط التالي: https://github.com/openai/guided-diffusion

نماذج التباعد تتفوق على GANs في تصنيع الصور | أحدث الأوراق البحثية | HyperAI