Command Palette
Search for a command to run...
Flux SAC
Le projet SAC Flow a été proposé conjointement en octobre 2025 par une équipe de recherche de l'Université Tsinghua, de l'Université Carnegie Mellon et d'autres universités et institutions. Les résultats de cette recherche ont été publiés dans l'article « Attaques adverses contre les MLLM à code source fermé via l'alignement optimal des caractéristiques".
SAC Flow est un algorithme d'apprentissage par renforcement hors ligne performant et efficace pour les exemples de politiques basées sur les flux. Il résout le problème d'instabilité du gradient lors de l'entraînement de ces politiques en traitant le modèle de flux comme un modèle de séquence et en reparamétrant son réseau de vitesse à l'aide d'une GRU ou d'un Transformer. Les chercheurs ont évalué les performances de SAC Flow lors d'entraînements de novo et d'entraînements passant du hors ligne au en ligne, démontrant une convergence rapide et des performances de pointe sur de nombreuses tâches de mouvement et de manipulation.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.