Search for a command to run...
CAR-bench: تقييم الاتساق والوعي بالحدود لوكالات LLM في ظل عدم اليقين في العالم الحقيقي