SciRE-Solver: تسريع عينات نماذج التشتت من خلال حلّال المُكَوِّنَة المُشتقّة المُتَتَالِيَة مع الفرق المتكرر

أحرزت نماذج التشتت (DMs) تقدماً كبيراً في مجالات توليد الصور والصوت والفيديو. أحد عيوب نماذج التشتت هو عملية التكرار البطيئة. تم تصميم الخوارزميات الحديثة للعينة السريعة من منظور المعادلات التفاضلية. ومع ذلك، في الخوارزميات ذات الرتبة العالية المستندة إلى توسيع تايلور، يصبح تقدير المشتقة لدالة التقييم (score function) غير قابل للحل بسبب تعقيد الشبكات العصبية الكبيرة والمدربة جيداً. مدفوعين بهذا الدافع، نقدم في هذه الدراسة طريقة الفرق المتكرر (RD) لحساب مشتقة دالة التقييم في مجال نماذج التشتت. استناداً إلى طريقة الفرق المتكرر وتوسيع تايلور المقطوع لدالة التكامل المرتبطة بالتقدير، نقترح خوارزمية SciRE-Solver التي تضمن تقارب من رتبة معينة لتسريع عملية العينة في نماذج التشتت. ولدراسة فعالية طريقة الفرق المتكرر بشكل أعمق، نقترح أيضاً نسخة مُعدّلة تُسمى SciREI-Solver، المستندة إلى طريقة الفرق المتكرر والمتّسق الأسّي (exponential integrator). تحقق الخوارزميات المقترحة لعملية العينة باستخدام طريقة الفرق المتكرر أداءً متفوّقاً على مستوى الحالة الحالية (SOTA) من حيث مؤشر FID مقارنة بالخوارزميات الحالية للعينة دون تدريب، سواء في النماذج المدربة مسبقاً ذات الزمن المتقطع أو المستمر، تحت مختلف عدد تقييمات دالة التقييم (NFE). وبشكل ملحوظ، تُظهر خوارزمية SciRE-Solver باستخدام عدد صغير من تقييمات دالة التقييم إمكانات واعدة للتفوّق على مؤشر FID المحقّق من قبل بعض النماذج المدربة مسبقاً في أوراقها الأصلية، والتي استخدمت 1000 تقييم على الأقل. على سبيل المثال، نحقّق قيمة SOTA لـ 2.40 FID باستخدام 100 تقييم لنموذج التشتت المستمر على CIFAR-10، و3.15 FID باستخدام 84 تقييمًا لنموذج التشتت المتقطع على نفس المجموعة، كما نحقّق 2.17 (2.02) FID باستخدام 18 (50) تقييمًا على نموذج التشتت المتقطع على CelebA بحجم 64×64.