Search for a command to run...
RationalRewards: Reasoning Rewards が Training と Test Time の両方において Visual Generation を Scale する