Search for a command to run...
Wenn Werkzeuge versagen: Benchmarking dynamisches Replanning und Anomaliebewältigung in LLM Agents