HyperAI
Command Palette
Search for a command to run...
Leistungsergebnisse verschiedener Modelle auf diesem Benchmark
Metriken
Inst-level loose-accuracy
Inst-level strict-accuracy
Prompt-level loose-accuracy
Prompt-level strict-accuracy
4 Zeilen insgesamt