HyperAIHyperAI

Command Palette

Search for a command to run...

خطوات بيلمان المثلى لتصحيح معلمة التدفق في نماذج مطابقة التدفق

Bao Nguyen Binh Nguyen Viet Anh Nguyen

الملخص

يُعدّ التوافق التدفقي (Flow Matching) إطارًا قويًا لإنشاء عينات عالية الجودة في مجموعة متنوعة من التطبيقات، وخاصة في توليد الصور. ومع ذلك، فإن المتطلبات الحسابية الكبيرة التي تفرضها هذه النماذج، خصوصًا أثناء عملية التحسين الدقيق (finetuning) وعمليات الاستخلاص (sampling)، تمثل تحديات كبيرة في السياقات ذات الموارد المحدودة. تقدم هذه الورقة تقنية تُسمى "الخطوة المثلى لبِلمن (Bellman Optimal Stepsize Straightening - BOSS)" لاستخلاص نماذج توليدية تعتمد على التوافق التدفقي: حيث تهدف هذه التقنية إلى تحقيق استخلاص صور فعّال في عدد قليل من الخطوات مع الالتزام بقيود محددة على الموارد الحسابية. أولاً، تتضمن هذه التقنية خوارزمية برمجة ديناميكية تُحسّن الخطوات (stepsizes) للشبكة المُدرّبة مسبقًا. ثم تُحسّن الشبكة السرعة (velocity network) لتتوافق مع الخطوات المثلى، بهدف تسطيح مسارات التوليد. أظهرت تقييمات تجريبية واسعة النطاق في مهام توليد الصور فعالية تقنية BOSS من حيث استخدام الموارد وجودة الصور. أشارت نتائجنا إلى أن BOSS تحقق مكاسب كبيرة في الكفاءة مع الحفاظ على جودة عينات تنافسية، مما يُعدّ حلًا فعّالًا لسد الفجوة بين القيود المحدودة للموارد والمتطلبات الصارمة للنماذج التوليدية القائمة على التوافق التدفقي. كما تُعزز هذه الورقة تطوير الذكاء الاصطناعي المسؤول، من خلال تقديم نموذج توليدية أكثر استدامة يقلّل من التكاليف الحسابية والأثر البيئي. يمكن الاطلاع على الكود الخاص بنا من خلال الرابط التالي: https://github.com/nguyenngocbaocmt02/BOSS.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp