Command Palette

Search for a command to run...

HPDv3 文生图人类偏好数据集

日期

3 个月前

大小

16.23 GB

机构

CUHK MMLab(香港中文大学多媒体实验室)

论文链接

arxiv.org

许可协议

MIT

HPDv3 是由 Mizzen AI 研究团队,联合香港中文大学多媒体实验室(MMLab)、伦敦国王学院等作者团队提出,并于 2025 年发布,是首个面向多领域的广谱人类偏好数据集。相关论文成果为 「HPSv3: Towards Wide-Spectrum Human Preference Score」,并已入选 ICCV 2025 。该数据集面向文本到图像生成模型的对齐、重排与评测,旨在推动模型在贴近人类审美与提升语义一致性方面的进展。

该数据集包含 108 万个文本-图像对和 117 万个带注释的成对比较数据,涵盖高质量与低质量的真实照片,且标注信息丰富,其中训练集约 114 万条、测试约 1.44 万条,适用于刻画广泛的人类偏好。

数据包含:

  • 文本:prompt(英文)
  • 成对图像路径:path1 、 path2(解压图像包后与路径对齐)
  • 模型来源:model1 、 model2
  • 偏好标注:choice_dist(投票分布,可为空)、 confidence(置信度,可为空)
  • 约定:path1 始终对应更受偏好的图像
数据集示例

HPDv3.torrent
做种 1正在下载 0已完成 23总下载次数 109
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供