HyperAI

Question Answering On Stepgame

Metriken

1-of-100 Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
Modellname1-of-100 Accuracy
stepgame-a-new-benchmark-for-robust-multi-hop-152.99