خطوات بيلمان المثلى لتصحيح معلمة التدفق في نماذج مطابقة التدفق

يُعدّ التوافق التدفقي (Flow Matching) إطارًا قويًا لإنشاء عينات عالية الجودة في مجموعة متنوعة من التطبيقات، وخاصة في توليد الصور. ومع ذلك، فإن المتطلبات الحسابية الكبيرة التي تفرضها هذه النماذج، خصوصًا أثناء عملية التحسين الدقيق (finetuning) وعمليات الاستخلاص (sampling)، تمثل تحديات كبيرة في السياقات ذات الموارد المحدودة. تقدم هذه الورقة تقنية تُسمى "الخطوة المثلى لبِلمن (Bellman Optimal Stepsize Straightening - BOSS)" لاستخلاص نماذج توليدية تعتمد على التوافق التدفقي: حيث تهدف هذه التقنية إلى تحقيق استخلاص صور فعّال في عدد قليل من الخطوات مع الالتزام بقيود محددة على الموارد الحسابية. أولاً، تتضمن هذه التقنية خوارزمية برمجة ديناميكية تُحسّن الخطوات (stepsizes) للشبكة المُدرّبة مسبقًا. ثم تُحسّن الشبكة السرعة (velocity network) لتتوافق مع الخطوات المثلى، بهدف تسطيح مسارات التوليد. أظهرت تقييمات تجريبية واسعة النطاق في مهام توليد الصور فعالية تقنية BOSS من حيث استخدام الموارد وجودة الصور. أشارت نتائجنا إلى أن BOSS تحقق مكاسب كبيرة في الكفاءة مع الحفاظ على جودة عينات تنافسية، مما يُعدّ حلًا فعّالًا لسد الفجوة بين القيود المحدودة للموارد والمتطلبات الصارمة للنماذج التوليدية القائمة على التوافق التدفقي. كما تُعزز هذه الورقة تطوير الذكاء الاصطناعي المسؤول، من خلال تقديم نموذج توليدية أكثر استدامة يقلّل من التكاليف الحسابية والأثر البيئي. يمكن الاطلاع على الكود الخاص بنا من خلال الرابط التالي: https://github.com/nguyenngocbaocmt02/BOSS.