HyperAI초신경

Calm

평가 지표

0-shot cot
0-shot icl
1-shot icl
3-shot icl
average
basic
cn
doubt
ef
en
ignore
llm_model
manual cot
model_url
organization
parameters
release_date
robustness
std
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름0-shot cot0-shot icl1-shot icl3-shot iclaveragebasiccndoubtefenignorellm_modelmanual cotmodel_urlorganizationparametersrelease_daterobustnessstdupdated_time
모델 154.551.954.160.056.854.452.654.652.158.453.9GPT-475.4https://openai.com/product/gpt-4OpenAIN/A2023/3/1483.79.92024/5/1