Command Palette

Search for a command to run...

PubMedVision 医疗多模态评估数据集

日期

19 天前

机构

National Health Data Institute,Shenzhen
深圳市大数据研究院

论文链接

2406.19280

许可协议

Apache 2.0

PubMedVision 是由深圳大数据研究院联合香港中文大学(深圳)、国家医疗健康大数据研究院(深圳)于 2024 年发布的一个用于医学多模态能力评估的数据集,相关论文成果为「HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale」,旨在为多模态大语言模型(MLLMs)在医疗视觉 – 文本理解任务方面提供标准化测试资源,以检验它们在医学领域的视觉知识融合与推理性能。

该数据集共包含约 130 万条医学视觉问答(VQA)样本,其中 647,031 条为对齐型 VQA,另有 647,031 条为指令微调 VQA 。 数据基于 914,960 张经过严格筛选的医学图像及其上下文文本(如标题与文中引用)构建,涵盖多种医学成像模态与解剖区域。每条样本由医学论文中的图像及说明性文字组成,并借助多模态大语言模型(如 GPT-4V)生成对应的图像描述、问题与答案。

数据集示例

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供