Command Palette

Search for a command to run...

seq-monkey 序列猴子开源数据集 1.0

日期

2 年前

大小

10.73 GB

机构

发布地址

github.com

序列猴子是出门问问提供的超大规模语言模型,序列猴子数据集是用于训练序列猴子模型的数据集合,现抽取部分数据集向公众开放。

1.0 版本的数据集涉及领域包括:中文通用文本语料、古诗今译语料、文本生成语料。其中中文通用文本语料是序列猴子训练集中抽取了 1,300 万份数据面向公众开放。古诗今译开源数据集是古文和现代文翻译数据集,开放 68 万首。文本生成微调数据集开放了 5 千条问答数据,可用于字词错误检测、字词错误纠正及文本润色任务。

seq-monkey.torrent
做种 1正在下载 0已完成 382总下载次数 859
  • seq-monkey/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • seq-monkey-data-main 2.zip
          10.73 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供