Search for a command to run...
OccuBench: Evaluierung von AI Agents bei realen professionellen Aufgaben mittels Language World Models