Command Palette

Search for a command to run...

LongAlign 10K 大模型长上下文对齐数据集

日期

2 年前

大小

392.42 MB

机构

清华大学

标签

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。

在构建过程中,该数据集首先从书籍、百科全书、学术论文、代码等 9 大不同领域汲取素材, 然后运用 Claude 2.1 大模型,在长篇背景之下生成多样化任务与答案。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

LongAlign.torrent
做种 1正在下载 0已完成 268总下载次数 422
  • LongAlign/
    • README.md
      1.28 KB
    • README.txt
      2.57 KB
      • data/
        • LongAlign-10k.zip
          392.42 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供