Search for a command to run...
CAR-bench : Évaluation de la cohérence et de la prise en compte des limites des agents LLM face à l'incertitude du monde réel