HyperAI

Calm

المقاييس

0-shot cot
0-shot icl
1-shot icl
3-shot icl
average
basic
cn
doubt
ef
en
ignore
llm_model
manual cot
model_url
organization
parameters
release_date
robustness
std
updated_time

النتائج

نتائج أداء النماذج المختلفة على هذا المعيار القياسي

جدول المقارنة
اسم النموذج0-shot cot0-shot icl1-shot icl3-shot iclaveragebasiccndoubtefenignorellm_modelmanual cotmodel_urlorganizationparametersrelease_daterobustnessstdupdated_time
النموذج 154.551.954.160.056.854.452.654.652.158.453.9GPT-475.4https://openai.com/product/gpt-4OpenAIN/A2023/3/1483.79.92024/5/1