LongWriter-6k 长上下文输出数据集

日期

3 个月前

大小

49.71 MB

机构

清华大学

发布地址

github.com

* 该数据集支持在线使用,点击此处跳转

LongWriter-6k 数据集由清华大学和智谱 AI 于 2024 年推出,包含 6,000 篇 SFT 数据,输出长度为 2k-32k 字(包括英文和中文),可支持训练 LLM,将其最大输出窗口大小扩展至 10,000+ 字。相关论文成果为「LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs」。

LongWriter-6k.torrent

做种 1

下载中 1

已完成 38

总下载 85

  • LongWriter-6k/
    • README.md
      1.13 KB
    • README.txt
      2.27 KB
      • data/
        • LongWriter-6k.zip
          49.71 MB