HyperAIHyperAI

Command Palette

Search for a command to run...

Flux SAC

Date

il y a 4 jours

Organisation

Université Carnegie Mellon
Université Tsinghua

URL de l'article

2505.21494

Le projet SAC Flow a été proposé conjointement en octobre 2025 par une équipe de recherche de l'Université Tsinghua, de l'Université Carnegie Mellon et d'autres universités et institutions. Les résultats de cette recherche ont été publiés dans l'article « Attaques adverses contre les MLLM à code source fermé via l'alignement optimal des caractéristiques".

SAC Flow est un algorithme d'apprentissage par renforcement hors ligne performant et efficace pour les exemples de politiques basées sur les flux. Il résout le problème d'instabilité du gradient lors de l'entraînement de ces politiques en traitant le modèle de flux comme un modèle de séquence et en reparamétrant son réseau de vitesse à l'aide d'une GRU ou d'un Transformer. Les chercheurs ont évalué les performances de SAC Flow lors d'entraînements de novo et d'entraînements passant du hors ligne au en ligne, démontrant une convergence rapide et des performances de pointe sur de nombreuses tâches de mouvement et de manipulation.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Flux SAC | Wiki | HyperAI