HyperAIHyperAI

Command Palette

Search for a command to run...

الانتشار المرتبط: توحيد عملية الانتشار عبر الدقائق المختلفة لتركيب الصور

Jiayan Teng Wendi Zheng Ming Ding Wenyi Hong Jianqiao Wangni Zhuoyi Yang Jie Tang

الملخص

أحرزت نماذج الانتشار نجاحًا كبيرًا في توليد الصور، لكنها ما زالت تواجه تحديات في توليد الصور عالية الدقة. ومن منظور التحويل التوافقي المنتظم، نجد أن السبب الرئيسي هو أن مستوى الضوضاء نفسه في دقة أعلى يؤدي إلى نسبة إشارة إلى ضوضاء أعلى في مجال الترددات. في هذا العمل، نقدم نموذج الانتشار المرتبط (RDM)، الذي يحول صورة منخفضة الدقة أو ضوضاء إلى نسخة مكافئة عالية الدقة باستخدام تقنيات تشتت التمويه وضوضاء الكتل. وبذلك، يمكن استمرار عملية الانتشار بسلاسة في أي دقة جديدة أو نموذج دون الحاجة إلى إعادة البدء من ضوضاء نقية أو من شرط منخفض الدقة. يحقق RDM أداءً متقدمًا على مستوى الحد الأدنى من خطأ التوزيع (FID) على مجموعة بيانات CelebA-HQ، وأداءً متقدمًا على مستوى خطأ التوزيع المعدل (sFID) على مجموعة ImageNet بحجم 256×256، متفوقًا بفارق كبير على النماذج السابقة مثل ADM وLDM وDiT. تم إتاحة جميع الكودات والبيانات التدريبية (checkpoints) مفتوحة المصدر عبر الرابط: \url{https://github.com/THUDM/RelayDiffusion}.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الانتشار المرتبط: توحيد عملية الانتشار عبر الدقائق المختلفة لتركيب الصور | مستندات | HyperAI