نماذج الانتقال: إعادة التفكير في هدف التعلم التوليدي

يظل هناك تناقض جوهري في نماذج التوليد: حيث تحقق نماذج التشتت التكراري أداءً متميزًا من حيث الدقة، لكن بتكاليف حسابية كبيرة، في حين أن البدائل الفعّالة التي تعتمد على عدد قليل من الخطوات مُقيَّدة بحد أقصى للجودة. ويُعزى هذا التناقض بين عدد خطوات التوليد ومستوى الجودة إلى أهداف تدريب محدودة تركز حصريًا إما على الديناميات اللانهائية الصغيرة (المعادلات التفاضلية العشوائية المُعادلة) أو على التنبؤ المباشر بالحالة النهائية. ونعالج هذه التحديات من خلال تقديم معادلة ديناميكية دقيقة ومستمرة عبر الزمن، تُعرّف تحليليًا انتقالات الحالة عبر أي فترة زمنية منتهية. وهذا يؤدي إلى نموذج توليد جديد يُسمى نماذج الانتقال (TiM)، التي تتكيف مع انتقالات متعددة الخطوات، وتمكّن من التحرك بسلاسة على طول المسار التوليدي من خطوات كبيرة إلى تحسينات دقيقة بزيادة عدد الخطوات. وعلى الرغم من امتلاكها فقط 865 مليون معلمة، فإن TiM تحقق أداءً يُعدّ الأفضل في مجاله، وتفوق نماذج رائدة مثل SD3.5 (بمعلمة 8 مليار) وFLUX.1 (بمعلمة 12 مليار) في جميع عدد الخطوات التي تم اختبارها. وبشكل مهم، على عكس النماذج القليلة الخطوات السابقة، تُظهر TiM تحسّنًا متزايدًا في الجودة بشكل منتظم مع زيادة ميزانية العينات. علاوةً على ذلك، عند استخدام استراتيجيتنا المُصممة خصيصًا للدقة الأصلية (native-resolution)، تُقدّم TiM دقة استثنائية بدقائق تصل إلى 4096×4096.