HyperAI超神経

Logical Reasoning On Ruworldtree

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
tape-assessing-few-shot-russian-language38.0
tape-assessing-few-shot-russian-language83.7
tape-assessing-few-shot-russian-language34.0
tape-assessing-few-shot-russian-language40.7