SAC-Durchfluss
SAC Flow wurde im Oktober 2025 von einem Forschungsteam der Tsinghua-Universität, der Carnegie Mellon University und weiterer Universitäten und Institutionen gemeinsam vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „Adversarial Attacks against Closed-Source MLLMs via Feature Optimal Alignment".
SAC Flow ist ein effizienter und leistungsstarker Offline-Reinforcement-Learning-Algorithmus für flussbasierte Policy-Beispiele. Er behebt das Problem der Gradienteninstabilität beim Training flussbasierter Policies, indem er das flussbasierte Modell als Sequenzmodell behandelt und dessen Geschwindigkeitsnetzwerk als GRU oder Transformer reparametrisiert. Forscher evaluierten die Leistung von SAC Flow sowohl im De-novo-Training als auch im Offline-zu-Online-Training und demonstrierten eine schnelle Konvergenz sowie Bestleistungen bei verschiedenen Bewegungs- und Manipulationsaufgaben.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.