Search for a command to run...
VerifyBench: Ein systematischer Benchmark zur Bewertung von Reasoning-Verifizierern in verschiedenen Bereichen