Search for a command to run...
WeaveBench: Ein Langzeit-, Realwelt-Benchmark für Computer-Use Agents mit hybriden Schnittstellen