PFGM++: فتح إمكانات النماذج التوليدية المستوحاة من الفيزياء

نقدم عائلة جديدة من نماذج التوليد المستوحاة من الفيزياء تُسمى PFGM++ التي توحّد بين نماذج الانتشار ونماذج التوليد بتدفق بواسون (PFGM). تقوم هذه النماذج بتحقيق مسارات توليدية للبيانات ذات الأبعاد $N$ عن طريق غمر المسارات في فضاء ذي أبعاد $N{+}D$ مع الحفاظ على التحكم في التقدم باستخدام قياس بسيط للمتغيرات الإضافية البالغة $D$. تنخفض النماذج الجديدة إلى PFGM عندما تكون $D{=}1$ وإلى نماذج الانتشار عندما تكون $D{\to}\infty$. يتيح لنا مرونة اختيار $D$ التوفيق بين المتانة والصلابة، حيث يؤدي زيادة $D$ إلى تركيز أكبر في الارتباط بين البيانات والمقياس الإضافي. نتخلى عن الأهداف المضخمة الكبيرة المتحيزة المستخدمة في PFGM ونقدم بدلاً منها هدفًا غير متحيز يستند إلى الاضطراب مشابهًا لنماذج الانتشار. لاستكشاف اختيارات مختلفة لـ $D$، نوفر طريقة تنسيق مباشرة لنقل المعلمات الفائقة المحسّنة من نماذج الانتشار ($D{\to} \infty$) إلى أي قيم محددة لـ $D$. تظهر تجاربنا أن النماذج ذات الأبعاد المحددة لـ $D$ يمكن أن تكون أفضل من النماذج الرائدة سابقًا لنماذج الانتشار على مجموعات بيانات CIFAR-10/FFHQ بحجم $64{\times}64$، بمعدلات FID تبلغ $1.91/2.43$ عند استخدام $D{=}2048/128$. وفي الإعداد الشرطي للتصنيف، يحقق $D{=}2048$ معدل FID الحالي الرائد وهو $1.74$ على CIFAR-10. بالإضافة إلى ذلك، نثبت أن النماذج ذات الأبعاد الصغيرة لـ $D$ تتمتع بمتانة أكبر ضد أخطاء النمذجة. يمكن الوصول إلى الكود عبر الرابط: https://github.com/Newbeeer/pfgmpp