HyperAI超神经
首页
资讯
最新论文
教程
数据集
顶会
百科
SOTA
LLM 模型天梯
开源项目
全站搜索
关于
中文
HyperAI超神经
Toggle sidebar
全站搜索…
⌘
K
首页
SOTA
Multi Task Language Understanding
Multi Task Language Understanding
基准测试列表
该任务相关的所有基准测试列表
bbh-alg
最佳模型: code-davinci-002 175B (CoT)
评估指标
查看详情
bbh-nlp
最佳模型: Flan-PaLM 540B (3-shot, fine-tuned, CoT + SC)
评估指标
查看详情
mgsm
评估指标
查看详情
mmlu
最佳模型: ds-r1(671b)
评估指标
查看详情
mmlu-5-shot
最佳模型: Sakalti/ultiima-78B
评估指标
查看详情