Command Palette

Search for a command to run...

PubMedVision 大规模医学 VQA 数据集

日期

1 年前

大小

53.54 GB

机构

发布地址

github.com

论文链接

arxiv.org

* 该数据集支持在线使用,点击此处跳转

PubMedVision 是一个大规模且高质量的医疗多模态数据集,由深圳市大数据研究院、香港中文大学和 National Health Data Institute 的研究团队于 2024 年创建,包含 130 万个医学 VQA 样本。相关论文成果为「HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale」。

该数据集通过精细的数据处理方法,从 PubMed 国际医学期刊的论文中筛选出与医疗相关的图片及有信息量的图片描述,有效过滤了大量医疗无关的图片和上下文不相关内容。为了提高图文数据的对齐度,研究团队采用视觉大模型 (GPT-4V) 对图片进行重新描述,并构建了 10 个场景的对话,将图文数据改写为问答形式,增强了医疗视觉知识的学习。

PubMedVision.torrent
做种 1正在下载 0已完成 216总下载次数 679
  • PubMedVision/
    • README.md
      1.46 KB
    • README.txt
      2.93 KB
      • data/
        • PubMedVision.zip
          53.54 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供