HyperAIHyperAI

Command Palette

Search for a command to run...

SAC-Durchfluss

Datum

vor 4 Tagen

Organisation

Carnegie Mellon Universität
Tsinghua-Universität

Paper-URL

2505.21494

SAC Flow wurde im Oktober 2025 von einem Forschungsteam der Tsinghua-Universität, der Carnegie Mellon University und weiterer Universitäten und Institutionen gemeinsam vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „Adversarial Attacks against Closed-Source MLLMs via Feature Optimal Alignment".

SAC Flow ist ein effizienter und leistungsstarker Offline-Reinforcement-Learning-Algorithmus für flussbasierte Policy-Beispiele. Er behebt das Problem der Gradienteninstabilität beim Training flussbasierter Policies, indem er das flussbasierte Modell als Sequenzmodell behandelt und dessen Geschwindigkeitsnetzwerk als GRU oder Transformer reparametrisiert. Forscher evaluierten die Leistung von SAC Flow sowohl im De-novo-Training als auch im Offline-zu-Online-Training und demonstrierten eine schnelle Konvergenz sowie Bestleistungen bei verschiedenen Bewegungs- und Manipulationsaufgaben.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
SAC-Durchfluss | Wiki | HyperAI