HyperAIHyperAI

Command Palette

Search for a command to run...

控制台

Arena-Write 写作生成评测数据集

日期

18 小时前

组织

清华大学

论文 URL

2506.18841

许可证

Apache 2.0

Arena-Write 是由新加坡科技设计大学联合清华大学知识工程实验室于 2025 年发布的一个面向超长文本生成模型评测的写作任务数据集,相关论文成果为 LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning,旨在在贴近真实使用场景的条件下系统评估大语言模型在长篇内容生成与复杂写作任务中的综合能力。

该数据集共包含 100 条用户写作任务,每条数据由一条真实写作提示构成,并标注对应的写作场景类型。任务覆盖社交媒体帖子、文章与报告等多种文本形式,在输出长度上呈现明显差异,既包含数百字的短文本写作任务,也包含要求生成超过 2,000 字的长文本任务。除写作提示外,数据中还提供了多种主流基线模型在同一任务上的生成结果,用于支持不同模型输出之间的对比评测。

用 AI 构建 AI

从构思到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格加速您的 AI 开发。

AI 协同编码
可直接使用的 GPU
最佳价格

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供