Search for a command to run...
RationalRewards : Utiliser les Reasoning Rewards pour mettre à l'échelle la génération visuelle au moment de l'entraînement et de l'inférence.