HyperAI超神経

Question Answering On Stepgame

評価指標

1-of-100 Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名1-of-100 Accuracy
stepgame-a-new-benchmark-for-robust-multi-hop-152.99