HyperAI超神経

Ethics On Ethics 2

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
tape-assessing-few-shot-russian-language60.9
tape-assessing-few-shot-russian-language67.6
tape-assessing-few-shot-russian-language44.9
tape-assessing-few-shot-russian-language44.1