C Eval
評価指標
ceval
cevalhard
cevalhumanities
cevalother
cevalsocialscience
cevalstem
key
model
num
org
rank
time
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | ceval | cevalhard | cevalhumanities | cevalother | cevalsocialscience | cevalstem | key | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|---|
モデル 1 | 98.500000 | 95.700000 | 99.600000 | 98.500000 | 99.300000 | 97.500000 | 1.000000 | Aquila2-34B | 34B | BAAI | 1.000000 | 2023/10/25 |