日期

2 年前

大小

1.28 GB

数据集组织

论文 URL

arxiv.org

标签

AI for Science

该数据集由 Google Research 和霍普金斯大学的研究团队于 2024 年推出，相关论文成果为「SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers」。

研究背景

在长篇科学研究文章中寻找问题的答案是一个重要的研究领域，它可以帮助读者快速解决他们的疑问。然而，现有的基于科学论文的问答 (QA) 数据集规模有限，并且仅关注文本内容。为了解决这一限制，研究团队推出了 SPIQA（科学论文图像问答）。

数据集概述

这是第一个专门设计用于解释计算机科学各个领域科学研究文章中复杂图形和表格的大型 QA 数据集。利用多模态大型语言模型 (MLLM) 的专业知识和理解图形的能力。研究团队设计了一个信息搜索任务，涉及多个图像，涵盖各种图表、表格、示意图和结果可视化，采用自动和手动管理来创建数据集。 SPIQA 包含 270K 个问题，分为训练、验证和三个不同的评估部分。通过对 12 个著名的基础模型进行大量实验，团队评估了当前多模态系统理解研究文章细微方面的能力。

SPIQA.torrent

做种 1正在下载 0已完成 204总下载量 254

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

1.28 GB

数据集组织

论文 URL

arxiv.org

标签

AI for Science

该数据集由 Google Research 和霍普金斯大学的研究团队于 2024 年推出，相关论文成果为「SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers」。

研究背景

数据集概述

SPIQA.torrent

做种 1正在下载 0已完成 204总下载量 254

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

4 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

SPIQA 多模态科学论文问答数据集

研究背景

数据集概述

用 AI 构建 AI

HyperAI Newsletters

Command Palette

SPIQA 多模态科学论文问答数据集

研究背景

数据集概述

相关数据集

CHOCLO 拉丁美州文化基准数据集

DRACO 跨领域深度研究基准数据集

ToolACE 复杂工具学习对话数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

Open-RL 推理问题数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

RubricHub_v1 多领域生成任务数据集

CL-bench 上下文学习评估基准数据集

RoVid-X 机器人视频生成数据集

DeepPlanning 长期规划能力评估数据集

LightOnOCR-mix-0126 文本转录数据集

TransPhy3D 透明反射合成视频数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

X-ray 违禁品检测数据集

MCD-rPPG 多摄像头远程光体积描记数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

SPIQA 多模态科学论文问答数据集

研究背景

数据集概述

相关数据集

CHOCLO 拉丁美州文化基准数据集

DRACO 跨领域深度研究基准数据集

ToolACE 复杂工具学习对话数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

Open-RL 推理问题数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

RubricHub_v1 多领域生成任务数据集

CL-bench 上下文学习评估基准数据集

RoVid-X 机器人视频生成数据集

DeepPlanning 长期规划能力评估数据集

LightOnOCR-mix-0126 文本转录数据集

TransPhy3D 透明反射合成视频数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

X-ray 违禁品检测数据集

MCD-rPPG 多摄像头远程光体积描记数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

CHOCLO 拉丁美州文化基准数据集

DRACO 跨领域深度研究基准数据集

ToolACE 复杂工具学习对话数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

Open-RL 推理问题数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

RubricHub_v1 多领域生成任务数据集

CL-bench 上下文学习评估基准数据集

RoVid-X 机器人视频生成数据集

DeepPlanning 长期规划能力评估数据集

LightOnOCR-mix-0126 文本转录数据集

TransPhy3D 透明反射合成视频数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

X-ray 违禁品检测数据集