HPDv3 文生图人类偏好数据集

日期

22 天前

大小

16.23 GB

机构

CUHK MMLab(香港中文大学多媒体实验室)

发布地址

huggingface.co

论文链接

arxiv.org

许可协议

MIT

HPDv3 是由 Mizzen AI 研究团队,联合香港中文大学多媒体实验室(MMLab)、伦敦国王学院等作者团队提出,并于 2025 年发布,是首个面向多领域的广谱人类偏好数据集。相关论文成果为 「HPSv3: Towards Wide-Spectrum Human Preference Score」,并已入选 ICCV 2025 。该数据集面向文本到图像生成模型的对齐、重排与评测,旨在推动模型在贴近人类审美与提升语义一致性方面的进展。

该数据集包含 108 万个文本-图像对和 117 万个带注释的成对比较数据,涵盖高质量与低质量的真实照片,且标注信息丰富,其中训练集约 114 万条、测试约 1.44 万条,适用于刻画广泛的人类偏好。

数据包含:

  • 文本:prompt(英文)
  • 成对图像路径:path1 、 path2(解压图像包后与路径对齐)
  • 模型来源:model1 、 model2
  • 偏好标注:choice_dist(投票分布,可为空)、 confidence(置信度,可为空)
  • 约定:path1 始终对应更受偏好的图像
数据集示例

HPDv3.torrent
做种 1正在下载 0已完成 6总下载次数 29
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB
HPDv3 文生图人类偏好数据集 | 数据集 | HyperAI超神经