Search for a command to run...
DenseGRPO: Von spärlichen zu dichten Belohnungen für die Ausrichtung von Flow-Matching-Modellen