Search for a command to run...
Reward Hacking im Zeitalter großer Modelle: Mechanismen, emergente Fehlbeurteilungen (Misalignment) und Herausforderungen