الانتشار المرتبط: توحيد عملية الانتشار عبر الدقائق المختلفة لتركيب الصور

أحرزت نماذج الانتشار نجاحًا كبيرًا في توليد الصور، لكنها ما زالت تواجه تحديات في توليد الصور عالية الدقة. ومن منظور التحويل التوافقي المنتظم، نجد أن السبب الرئيسي هو أن مستوى الضوضاء نفسه في دقة أعلى يؤدي إلى نسبة إشارة إلى ضوضاء أعلى في مجال الترددات. في هذا العمل، نقدم نموذج الانتشار المرتبط (RDM)، الذي يحول صورة منخفضة الدقة أو ضوضاء إلى نسخة مكافئة عالية الدقة باستخدام تقنيات تشتت التمويه وضوضاء الكتل. وبذلك، يمكن استمرار عملية الانتشار بسلاسة في أي دقة جديدة أو نموذج دون الحاجة إلى إعادة البدء من ضوضاء نقية أو من شرط منخفض الدقة. يحقق RDM أداءً متقدمًا على مستوى الحد الأدنى من خطأ التوزيع (FID) على مجموعة بيانات CelebA-HQ، وأداءً متقدمًا على مستوى خطأ التوزيع المعدل (sFID) على مجموعة ImageNet بحجم 256×256، متفوقًا بفارق كبير على النماذج السابقة مثل ADM وLDM وDiT. تم إتاحة جميع الكودات والبيانات التدريبية (checkpoints) مفتوحة المصدر عبر الرابط: \url{https://github.com/THUDM/RelayDiffusion}.