HyperAIHyperAI

Command Palette

Search for a command to run...

MedChatZH 中文医疗对话指令数据集

日期

10 个月前

大小

1.31 GB

数据集组织

East China University of Science and Technology(华东理工大学)

发布 URL

github.com

论文 URL

2309.01114

许可证

Apache 2.0

MedChatZH 是由华东理工大学于 2023 年发布的一个中文医疗对话数据集,相关论文成果为「MedChatZH: A tuning LLM for traditional Chinese medicine consultations」,旨在通过中医典籍持续预训练和医疗指令数据微调,提升中文(尤其中医场景)问诊对话的理解与生成能力。 数据来源于超过 1k 本中医典籍与医家笔记,以及从互联网与多家中国医院汇集的超过 700 万条中文医疗指令并结合 BELLE-3.5M 通用指令,经过筛选清理得到医药类指令 763,629 条、通用指令 1,305,194 条,共同组成用于对话微调的 med-mix-2M 数据集,与中医典籍语料配合,分别服务于继续预训练与指令微调两个阶段。

MedChatZH.torrent
做种 4正在下载 1已完成 78总下载量 383
  • MedChatZH/
    • README.md
      1.53 KB
    • README.txt
      3.05 KB
      • data/
        • MedChatZH.zip
          1.31 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供