Search for a command to run...
BeSafe-Bench: Aufdeckung von Verhaltenssicherheitsrisiken situierter Agenten in funktionalen Umgebungen