HyperAIHyperAI

Command Palette

Search for a command to run...

Question Answering On Stepgame

Métriques

1-of-100 Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Paper TitleRepository
TP-MANN52.99StepGame: A New Benchmark for Robust Multi-Hop Spatial Reasoning in Texts
0 of 1 row(s) selected.