日期

9 个月前

大小

6.43 GB

数据集组织

论文 URL

2501.00321

标签

OCR

OCRBench-v2 是由华中科技大学联合华南理工大学、字节跳动等机构于 2025 年发布的一个多模态大型模型光学字符识别（OCR）的评估基准，相关论文成果为「OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning」，旨在评估大型多模态模型（LMM）在不同文本相关任务中的 OCR 能力。该数据集是在 OCRBench 基础上的大规模升级版本，包含 10,000 条经人工验证的中英文问答对作为公开测试集，并额外提供一个私有测试集，包含 1,500 张人工标注的富文本图像，图像来源多样，包括纸质书籍、电子书、扫描文档以及网页内容。数据涵盖 31 个典型文本场景，覆盖 23 个子任务，归类于 8 个核心 OCR 功能（文本识别、文本检测、文本引用定位、关系抽取、元素解析、数学运算、视觉-文本理解、知识推理）。

OCRBenchv2.torrent

做种 2正在下载 0已完成 38总下载量 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

9 个月前

大小

6.43 GB

数据集组织

论文 URL

2501.00321

标签

OCR

OCRBenchv2.torrent

做种 2正在下载 0已完成 38总下载量 159

OCRBenchv2/
- README.md
  1.81 KB
- README.txt
  3.62 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

DRACO 跨领域深度研究基准数据集

2 个月前

CHIMERA 通用推理合成数据集

8 天前

THINGS-EEG 脑电图数据集

5 个月前

THINGS-MEG 脑磁图数据集

5 个月前

THINGS-fMRI 功能磁共振成像数据集

5 个月前

CL-bench 上下文学习评估基准数据集

4 个月前

LightOnOCR-mix-0126 文本转录数据集

5 个月前

Nemotron-Math-v2 数学推理数据集

8 天前

GroundingME 复杂场景理解评测数据集

8 天前

MCIF 多模态跨语言指令跟随数据集

6 个月前

TxT360-3efforts 多任务推理数据集

8 天前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

OCRBench-v2 文本识别基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

OCRBench-v2 文本识别基准数据集

相关数据集

DRACO 跨领域深度研究基准数据集

CHIMERA 通用推理合成数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

CL-bench 上下文学习评估基准数据集

LightOnOCR-mix-0126 文本转录数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

OCRBench-v2 文本识别基准数据集

相关数据集

DRACO 跨领域深度研究基准数据集

CHIMERA 通用推理合成数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

CL-bench 上下文学习评估基准数据集

LightOnOCR-mix-0126 文本转录数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

CHIMERA 通用推理合成数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

CL-bench 上下文学习评估基准数据集

LightOnOCR-mix-0126 文本转录数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

相关数据集

DRACO 跨领域深度研究基准数据集

CHIMERA 通用推理合成数据集

THINGS-EEG 脑电图数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

CL-bench 上下文学习评估基准数据集

LightOnOCR-mix-0126 文本转录数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集