Command Palette

Search for a command to run...

SuperGPQA 学科领域评估基准数据集

日期

8 个月前

机构

论文链接

arxiv.org

许可协议

Apache 2.0

加入 Discord 社区

SuperGPQA 是一个用于评估高级问答系统性能的基准数据集,由 Multimodal Art Projection 团队于 2025 年开发,相关论文成果为「SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines」。该数据集专注于自然语言处理和机器学习评估领域,旨在通过跨学科的复杂问题来测试模型的推理能力和知识水平。

数据集涵盖了 285 个研究生级别的学科领域,问题类型多样,包括生物学、物理学、化学等多个科学领域。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供