HyperAI

Multimodal Reasoning On Algopuzzlevqa

Metriken

Acc

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAcc
are-language-models-puzzle-prodigies30.3