Search for a command to run...
CAR-bench: Evaluierung der Konsistenz und limitbewussten Wahrnehmung von LLM-Agenten unter realweltlicher Unsicherheit