التخزين التطورى لتسريع نموذج الانتشار الجاهز لديك

تتفوق نماذج توليد الصور القائمة على الانتشار في إنتاج محتوى صناعي عالي الجودة، ولكنها تعاني من استدلال بطيء ومكلف من الناحية الحسابية. حاولت الدراسات السابقة التخفيف من هذا الأمر من خلال تخزين وإعادة استخدام الخصائص داخل متحولات الانتشار عبر خطوات الاستدلال. ومع ذلك، تعتمد هذه الأساليب غالبًا على قواعد ثابتة تؤدي إلى تسريع محدود أو تعميم ضعيف عبر المعماريات المختلفة. نقترح خوارزمية التخزين التطورية لتسريع نماذج الانتشار (ECAD)، وهي خوارزمية وراثية تتعلم جداول تخزين فعالة لكل نموذج، مما يشكل حدًا باريتو باستخدام مجموعة صغيرة فقط من العبارات التحفيزية لل-Calibration. لا تتطلب ECAD أي تعديلات على معلمات الشبكة أو الصور المرجعية. إنها توفر زيادة كبيرة في سرعة الاستدلال، وتتيح السيطرة الدقيقة على التوازن بين الجودة والتأخير، وتناسب بسلاسة مع نماذج الانتشار المختلفة. وبشكل لافت للنظر، يمكن أن تعمم جداول التخزين التي تم تعلمها بواسطة ECAD بشكل فعال على الدقة والنسخ البديلة للنموذج التي لم يتم رؤيتها أثناء التحليق (Calibration). قمنا بتقييم ECAD على PixArt-alpha وPixArt-Sigma وFLUX-1.dev باستخدام عدة مقاييس (FID، CLIP، Image Reward) عبر مجموعة متنوعة من المقاييس (COCO، MJHQ-30k، PartiPrompts)، مما أظهر تحسينات مستمرة على الأساليب السابقة. وعلى PixArt-alpha، حددت ECAD جدولًا يتفوق على أفضل طريقة معروفة سابقًا بمقدار 4.47 COCO FID بينما زادت سرعة الاستدلال من 2.35 مرة إلى 2.58 مرة. تثبت نتائجنا أن ECAD هي طريقة قابلة للتطوير والتعميم لتسريع استدلال الانتشار. يمكن الوصول إلى موقع مشروعنا على الويب عبر الرابط https://aniaggarwal.github.io/ecad وكودنا متاح على الرابط https://github.com/aniaggarwal/ecad.