HyperAI超神経

Logical Reasoning On Lingoly

評価指標

Delta_NoContext
Exact Match Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果