OmniMedVQA 是一个专注于医疗领域的大型视觉问答 (Visual Question Answering, VQA) 评测数据集。这个数据集由香港大学与上海人工智能实验室于 2024 年联合推出,旨在为医学多模态大模型的发展提供评测基准。
OmniMedVQA 数据集的特点包括:
- 大规模和多样性:数据集包含 118,010 张不同的图片,涵盖 12 种不同的模态,涉及超过 20 个人体不同的器官和部位。
- 真实医疗场景:所有图像都来自真实的医疗场景,确保与医学领域的需求保持一致,并适合评估大型视图语言模型 (Large Vision-Language Models, LVLMs)。
- 多模态任务:数据集设计用于评估 LVLMs 在处理多模态任务时的表现,特别是在医学视觉问答方面的能力。
- 综合性:OmniMedVQA 是一个全面的评价基准,它不仅包括多种模态的医学图像,还涵盖了广泛的解剖区域,适合用于评估 LVLMs 在医学领域的潜力和性能。
- 公开可用:该数据集将公开提供给研究社区,以促进医学视觉问答领域的研究和模型开发。
OmniMedVQA 的创建是为了解决现有医学图像数据集在多样性和真实性方面的不足,并通过提供丰富的、基于真实医疗场景的图像和问题对,推动医学 AI 的发展和评估。
免责声明
OmniMedVQA 是基于多个公开的数据集构建,旨在取之于社区,回馈于社区,为研究人员和开发者提供一个用于学术和技术研究的资源。使用本数据集的任何个人或组织(以下统称为 “使用者”)需遵守以下免责声明:
- 数据集来源:本数据集基于多个公开的数据集构建,这些数据集的来源已在论文中明确标明。使用者应当遵守原始数据集的相关许可和使用条款。
- 数据准确性:尽管我们已经努力确保数据集的准确性和完整性,但使用者应自行承担使用数据集可能带来的风险和责任。
- 责任限制:在任何情况下,数据集的提供者及相关贡献者均不对使用者的任何行为或结果承担责任。
- 使用约束:使用者在使用本数据集时,应遵守适用的法律法规和伦理规范。使用者不得将本数据集用于非法、侵犯隐私、诽谤、歧视或其他违法或不道德的目的。
- 知识产权:本数据集所有影像数据的知识产权归原始数据集的相关权利人所有,使用者不得以任何方式侵犯数据集的知识产权。
- 作为非盈利机构,团队倡导和谐友好的开源交流环境,若在开源数据集内发现有侵犯您合法权益的内容,请联系我们,我们将尽最大努力协助您处理。
- 通过下载、复制、访问或使用本数据集,即表示使用者已阅读、理解并同意遵守本免责声明中的所有条款和条件。如果使用者无法接受本免责声明的任何部分,请勿使用本数据集。