Command Palette
Search for a command to run...
LongText-Bench 文本理解基准数据集
LongText-Bench 是由腾讯于 2025 年发布的一个文本理解基准数据集,相关论文成果为「X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again」,旨在评估模型准确理解长篇中文和英文文本的能力。
该数据集包含 160 个用于评估长文本渲染任务的提示语,涵盖 8 种不同场景(路牌、带标签的物体、印刷材料、网页、幻灯片、海报、标题和对话)。
数据集特点:
- 跨语言覆盖
- 文本长度
- 梯度设计