C Eval
评估指标
ceval
cevalhard
cevalhumanities
cevalother
cevalsocialscience
cevalstem
key
model
num
org
rank
time
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | ceval | cevalhard | cevalhumanities | cevalother | cevalsocialscience | cevalstem | key | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|---|
模型 1 | 98.500000 | 95.700000 | 99.600000 | 98.500000 | 99.300000 | 97.500000 | 1.000000 | Aquila2-34B | 34B | BAAI | 1.000000 | 2023/10/25 |