Search for a command to run...
WildScore: Benchmarking MLLMs im „Wilden“ der symbolischen Musik-Reasoning-Aufgaben