HyperAIHyperAI

Command Palette

Search for a command to run...

نماذج التباعد تتفوق على GANs في تصنيع الصور

Prafulla Dhariwal Alex Nichol

الملخص

نُظهر أن نماذج التشتت يمكنها تحقيق جودة عينات صور تفوق النماذج التوليدية الحالية الأفضل في مجالها. ونحقق ذلك في توليد الصور دون شرط من خلال اكتشاف بنية أفضل من خلال سلسلة من التحليلات التجريمية. أما في حالة التوليد الصوتي الشرطي، فإننا نُحسّن جودة العينات بشكل إضافي باستخدام التوجيه بواسطة الفاصل (classifier guidance): طريقة بسيطة وفعالة من حيث الحوسبة لاستبدال التنوّع بالدقة، باستخدام التدرجات الناتجة عن فاصل. ونحقق مؤشر FID قدره 2.97 على ImageNet بحجم 128×128، و4.59 على ImageNet بحجم 256×256، و7.72 على ImageNet بحجم 512×512، مع التماثل مع BigGAN-deep حتى باستخدام ما لا يقل عن 25 عملية تمرير أمامي لكل عينة، مع الحفاظ على تغطية أفضل لتوزيع البيانات. وأخيرًا، نجد أن التوجيه بواسطة الفاصل يتكامل بشكل جيد مع نماذج التشتت التي تعتمد على التكبير (upsampling diffusion models)، مما يُحسّن مؤشر FID إلى 3.94 على ImageNet بحجم 256×256، و3.85 على ImageNet بحجم 512×512. ونُطلق رمزنا البرمجي عبر الرابط التالي: https://github.com/openai/guided-diffusion


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp