Search for a command to run...
CREPE: Können Vision-Sprache-Grundmodellierungen kompositionell schließen?