HPDv3 人間の嗜好データセット

日付

22日前

サイズ

16.23 GB

組織

CUHK MMLab(香港中文大学マルチメディア研究所)

論文URL

arxiv.org

ライセンス

MIT

HPDv3は、Mizzen AI研究チームが香港中文大学マルチメディア研究所(MMLab)、キングス・カレッジ・ロンドン、その他の研究者チームと共同で提案したものです。2025年に公開され、複数分野を対象とした初の広範かつ包括的な人間の嗜好データセットです。 「HPSv3: 広範囲にわたる人間の嗜好スコアに向けて」、ICCV 2025に選ばれました。このデータセットは、テキストから画像への生成モデルの調整、再配置、評価を目的としており、人間の美学に近づき、意味の一貫性を向上させるモデルの進歩を促進することを目指しています。

このデータセットには、108万件のテキストと画像のペア、および117万件の注釈付き比較データが含まれており、豊富な注釈情報を備えた高品質および低品質の実写写真を網羅しています。トレーニングセットは約114万件、テストセットは約14,400件のアイテムで構成されており、人間の幅広い嗜好を特徴付けるのに適しています。

データには以下が含まれます:

  • テキスト: プロンプト(英語)
  • ペアの画像パス: path1、path2 (画像パッケージを解凍した後のパスと一致します)
  • モデルソース: model1、model2
  • 優先順位の注釈: choice_dist (投票分布、空でも可)、 confidence (信頼度、空でも可)
  • 慣例: path1 は常により優先される画像に対応する
データセットの例

HPDv3.torrent
シーディング 1ダウンロード中 0ダウンロード完了 6総ダウンロード数 29
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB
HPDv3 人間の嗜好データセット | データセット | HyperAI超神経