日期

2 年前

大小

29.29 GB

数据集组织

发布 URL

论文 URL

标签

MMPR (Multimodal Preference Dataset) 是由上海人工智能实验室、复旦大学、南京大学、香港中文大学、清华大学和商汤科技的研究团队于 2024 年共同发布的一个大规模的多模态偏好数据集，相关论文成果为「Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization」。该数据集包含 75 万无明确正确答案样本和 250 万有明确正确答案样本。样本覆盖了多个领域，如 VQA 、科学、图表、数学、 OCR 和文档，以确保多样性。在构建数据集时，研究者特别注意避免因启发式规则的局限性而导致的误报负响应，特别是在通用 VQA 和文档领域。数据集的设计旨在提高模型在多模态推理任务中的表现，同时避免训练过程中的潜在负面影响。

MMPR 中的数据示例。对于具有明确正确答案的指令，研究团队提出了一个基于正确性的流程，该流程采样多个解决方案，并将那些具有正确答案的视为选择响应，将那些具有错误答案的视为拒绝响应。对于没有明确正确答案的指令，研究团队提出使用 DropoutNTP 来生成拒绝响应。选择响应和拒绝响应之间的差异用斜体文本强调。红色高光表示错误的响应。

Citation

If you find this project useful in your research, please consider citing: “`BibTeX @article{wang2024mpo, title={Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization}, author={Wang, Weiyun and Chen, Zhe and Wang, Wenhai and Cao, Yue and Liu, Yangzhou and Gao, Zhangwei and Zhu, Jinguo and Zhu, Xizhou and Lu, Lewei and Qiao, Yu and Dai, Jifeng}, journal={arXiv preprint arXiv:2411.10442}, year={2024} } @article{chen2023internvl, title={InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks}, author={Chen, Zhe and Wu, Jiannan and Wang, Wenhai and Su, Weijie and Chen, Guo and Xing, Sen and Zhong, Muyan and Zhang, Qinglong and Zhu, Xizhou and Lu, Lewei and Li, Bin and Luo, Ping and Lu, Tong and Qiao, Yu and Dai, Jifeng}, journal={arXiv preprint arXiv:2312.14238}, year={2023} } @article{chen2024far, title={How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites}, author={Chen, Zhe and Wang, Weiyun and Tian, Hao and Ye, Shenglong and Gao, Zhangwei and Cui, Erfei and Tong, Wenwen and Hu, Kongzhi and Luo, Jiapeng and Ma, Zheng and others}, journal={arXiv preprint arXiv:2404.16821}, year={2024} }

MMPR-OpenGVLab.torrent

做种 1正在下载 0已完成 200总下载量 264

MMPR-OpenGVLab/
- README.md
  2.12 KB
- README.txt
  4.25 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

MAKIEVAL 多语言文化知识评估数据集

18 天前

Verbatim Spans 查询条件证据提取数据集

17 天前

Command Palette

MMPR 多模态推理偏好数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMPR 多模态推理偏好数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

DeepCrack 基础设施裂缝检测数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMPR 多模态推理偏好数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

DeepCrack 基础设施裂缝检测数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

DeepCrack 基础设施裂缝检测数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

ViMU 视频隐喻理解数据集

MemLens 多模态长上下文基准数据集

VisCoR-55K 视觉推理数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

MDPBench 多语言文档解析基准数据集

GPT-5.4-step-by-step-reasoning 逐步推理数据集

相关数据集

MAKIEVAL 多语言文化知识评估数据集