Command Palette
Search for a command to run...
تدفق SAC
تم اقتراح SAC Flow بشكل مشترك في أكتوبر 2025 من قبل فريق بحثي من جامعة تسينغهوا وجامعة كارنيجي ميلون وجامعات ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "الهجمات المعادية ضد MLLMs مغلقة المصدر من خلال محاذاة الميزات المثلى".
SAC Flow هي خوارزمية تعلّم تعزيزي فعّالة وعالية الأداء تعمل دون اتصال بالإنترنت، وتُستخدم لعينات السياسات القائمة على التدفق. تُعالج هذه الخوارزمية مشكلة عدم استقرار التدرج عند تدريب السياسات القائمة على التدفق، وذلك بمعاملة النموذج القائم على التدفق كنموذج تسلسلي وإعادة تحديد معلمات شبكة سرعته كوحدة GRU أو محول. قيّم الباحثون أداء SAC Flow في كلٍّ من إعدادات التدريب التجريبي والتدريب من دون اتصال بالإنترنت، مُظهرين تقاربًا سريعًا ومحققين أداءً متطورًا في مهام الحركة والمعالجة المتعددة.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.