Command Palette

Search for a command to run...

MedChatZH 中文医疗对话指令数据集

日期

2 个月前

大小

1.31 GB

机构

East China University of Science and Technology(华东理工大学)

发布地址

github.com

论文链接

2309.01114

许可协议

Apache 2.0

*该数据集支持在线使用,点击此处跳转

MedChatZH 是由华东理工大学于 2023 年发布的一个中文医疗对话数据集,相关论文成果为「MedChatZH: A tuning LLM for traditional Chinese medicine consultations」,旨在通过中医典籍持续预训练和医疗指令数据微调,提升中文(尤其中医场景)问诊对话的理解与生成能力。

数据来源于超过 1k 本中医典籍与医家笔记,以及从互联网与多家中国医院汇集的超过 700 万条中文医疗指令并结合 BELLE-3.5M 通用指令,经过筛选清理得到医药类指令 763,629 条、通用指令 1,305,194 条,共同组成用于对话微调的 med-mix-2M 数据集,与中医典籍语料配合,分别服务于继续预训练与指令微调两个阶段。

MedChatZH.torrent
做种 2正在下载 1已完成 20总下载次数 118
  • MedChatZH/
    • README.md
      1.53 KB
    • README.txt
      3.05 KB
      • data/
        • MedChatZH.zip
          1.31 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供