日期

1 年前

数据集组织

论文 URL

2507.22058

许可证

Apache 2.0

标签

基准

LongText-Bench 是由腾讯于 2025 年发布的一个文本理解基准数据集，相关论文成果为「X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again」，旨在评估模型准确理解长篇中文和英文文本的能力。该数据集包含 160 个用于评估长文本渲染任务的提示语，涵盖 8 种不同场景（路牌、带标签的物体、印刷材料、网页、幻灯片、海报、标题和对话）。

数据集特点：

跨语言覆盖
文本长度
梯度设计

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

1 年前

数据集组织

论文 URL

2507.22058

许可证

Apache 2.0

标签

基准

数据集特点：

跨语言覆盖
文本长度
梯度设计

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

DRACO 跨领域深度研究基准数据集

2 个月前

Groundsource 全球洪水事件数据集

3 个月前

CHIMERA 通用推理合成数据集

4 个月前

CL-bench 上下文学习评估基准数据集

4 个月前

GroundingME 复杂场景理解评测数据集

5 个月前

X-ray 违禁品检测数据集

5 个月前

LongBench-Pro 长上下文综合评测数据集

6 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

LongText-Bench 文本理解基准数据集

数据集特点：

用 AI 构建 AI

HyperAI Newsletters

Command Palette

LongText-Bench 文本理解基准数据集

数据集特点：

相关数据集

DRACO 跨领域深度研究基准数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

CL-bench 上下文学习评估基准数据集

GroundingME 复杂场景理解评测数据集

X-ray 违禁品检测数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

LongText-Bench 文本理解基准数据集

数据集特点：

相关数据集

DRACO 跨领域深度研究基准数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

CL-bench 上下文学习评估基准数据集

GroundingME 复杂场景理解评测数据集

X-ray 违禁品检测数据集

LongBench-Pro 长上下文综合评测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

CL-bench 上下文学习评估基准数据集

GroundingME 复杂场景理解评测数据集

X-ray 违禁品检测数据集

LongBench-Pro 长上下文综合评测数据集

相关数据集

DRACO 跨领域深度研究基准数据集

Groundsource 全球洪水事件数据集

CHIMERA 通用推理合成数据集

CL-bench 上下文学习评估基准数据集

GroundingME 复杂场景理解评测数据集

X-ray 违禁品检测数据集

LongBench-Pro 长上下文综合评测数据集