تدفق SAC
تم اقتراح SAC Flow بشكل مشترك في أكتوبر 2025 من قبل فريق بحثي من جامعة تسينغهوا وجامعة كارنيجي ميلون وجامعات ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "الهجمات المعادية ضد MLLMs مغلقة المصدر من خلال محاذاة الميزات المثلى".
SAC Flow هي خوارزمية تعلّم تعزيزي فعّالة وعالية الأداء تعمل دون اتصال بالإنترنت، وتُستخدم لعينات السياسات القائمة على التدفق. تُعالج هذه الخوارزمية مشكلة عدم استقرار التدرج عند تدريب السياسات القائمة على التدفق، وذلك بمعاملة النموذج القائم على التدفق كنموذج تسلسلي وإعادة تحديد معلمات شبكة سرعته كوحدة GRU أو محول. قيّم الباحثون أداء SAC Flow في كلٍّ من إعدادات التدريب التجريبي والتدريب من دون اتصال بالإنترنت، مُظهرين تقاربًا سريعًا ومحققين أداءً متطورًا في مهام الحركة والمعالجة المتعددة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.