HyperAI超神经
首页
资讯
最新论文
教程
数据集
顶会
百科
SOTA
LLM 模型天梯
开源项目
全站搜索
关于
中文
HyperAI超神经
Toggle sidebar
全站搜索…
⌘
K
首页
SOTA
Mathematical Reasoning
Mathematical Reasoning
基准测试列表
该任务相关的所有基准测试列表
aime24
最佳模型: DeepSeek-r1
评估指标
查看详情
lila-ood
最佳模型: Codex (Few-Shot, 175B)
评估指标
查看详情
math500
最佳模型: Search-o1
评估指标
查看详情
unigeo
最佳模型: GOLD
评估指标
查看详情
amc23
评估指标
查看详情
frontiermath
评估指标
查看详情
geoqa
评估指标
查看详情
lila-iid
评估指标
查看详情
mmlu-mathematics
评估指标
查看详情
pgps9k
评估指标
查看详情
unigeo-prv
评估指标
查看详情