使用此数据集

在 Discord 上讨论

日期

2 年前

大小

241.96 MB

数据集组织

论文 URL

标签

自然语言处理

人们普遍乐观地认为，前沿大语言模型 (LLM) 和 LLM 增强系统有可能迅速加速各学科的科学发现。如今，有很多基准可以衡量 LLM 在教科书式科学问题上的知识和推理能力，但很少有基准被用来评估语言模型在科学研究所需的实际任务（如文献检索、协议规划和数据分析）上的性能。作为建立此类基准的第一步，来自 FutureHouse 的研究团队于 2024 年推出了 Language Agent Biology Benchmark（简称 LAB-Bench），该数据集包含 2,400 多道选择题，用于评估人工智能系统在一系列实用生物学研究能力方面的表现，包括文献检索和推理能力、数据解读能力、接入和导航数据库的能力、理解控制 DNA 以及蛋白质序列的能力等等。相关论文成果为「LAB-Bench: Measuring Capabilities of Language Models for Biology Research」

LAB-Bench.torrent

做种 1正在下载 0已完成 188总下载量 393

LAB-Bench/
- README.md
  1.65 KB
- README.txt
  3.3 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

241.96 MB

数据集组织

论文 URL

标签

自然语言处理

人们普遍乐观地认为，前沿大语言模型 (LLM) 和 LLM 增强系统有可能迅速加速各学科的科学发现。如今，有很多基准可以衡量 LLM 在教科书式科学问题上的知识和推理能力，但很少有基准被用来评估语言模型在科学研究所需的实际任务（如文献检索、协议规划和数据分析）上的性能。作为建立此类基准的第一步，来自 FutureHouse 的研究团队于 2024 年推出了 Language Agent Biology Benchmark（简称 LAB-Bench），该数据集包含 2,400 多道选择题，用于评估人工智能系统在一系列实用生物学研究能力方面的表现，包括文献检索和推理能力、数据解读能力、接入和导航数据库的能力、理解控制 DNA 以及蛋白质序列的能力等等。相关论文成果为「LAB-Bench: Measuring Capabilities of Language Models for Biology Research」

LAB-Bench.torrent

做种 1正在下载 0已完成 188总下载量 393

LAB-Bench/
- README.md
  1.65 KB
- README.txt
  3.3 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

LAB Bench 语言模型生物学基准数据集 | 数据集 | HyperAI超神经