Search for a command to run...
WeaveBench : Un benchmark à long terme et du monde réel pour les Agents d'utilisation de l'ordinateur avec des interfaces hybrides