Search for a command to run...
Retrospektive Harness-Optimierung: Verbesserung von LLM-Agents durch Selbstpräferenz gegenüber Trajektorien-Rollouts