HyperAIHyperAI

HPDv3-Datensatz Zu Menschlichen Präferenzen

Datum

vor 22 Tagen

Größe

16.23 GB

Organisation

CUHK MMLab (Multimedialabor der Chinesischen Universität Hongkong)

Veröffentlichungs-URL

huggingface.co

Paper-URL

arxiv.org

Lizenz

MIT

HPDv3 wurde vom Mizzen AI-Forschungsteam in Zusammenarbeit mit dem Multimedia Laboratory (MMLab) der Chinesischen Universität Hongkong, dem King's College London und anderen Autorenteams vorgeschlagen. Es wurde 2025 veröffentlicht und ist der erste breit gefächerte Datensatz menschlicher Präferenzen für mehrere Bereiche. „HPSv3: Auf dem Weg zu einem breitbandigen menschlichen Präferenzscore“und wurde für ICCV 2025 ausgewählt. Dieser Datensatz zielt auf die Ausrichtung, Neuanordnung und Bewertung von Text-zu-Bild-Generierungsmodellen ab und soll den Fortschritt der Modelle bei der Annäherung an die menschliche Ästhetik und der Verbesserung der semantischen Konsistenz fördern.

Der Datensatz enthält 1,08 Millionen Text-Bild-Paare und 1,17 Millionen kommentierte Paarvergleichsdaten, die hochwertige und minderwertige reale Fotos mit umfangreichen Anmerkungsinformationen abdecken. Der Trainingssatz umfasst ungefähr 1,14 Millionen Elemente und der Testsatz ungefähr 14.400 Elemente, was zur Charakterisierung eines breiten Spektrums menschlicher Vorlieben geeignet ist.

Die Daten umfassen:

  • Text: prompt (Englisch)
  • Gepaarte Bildpfade: Pfad1, Pfad2 (ausgerichtet an den Pfaden nach dem Entpacken des Bildpakets)
  • Modellquellen: Modell1, Modell2
  • Präferenzannotation: choice_dist (Stimmverteilung, kann leer sein), confidence (Vertrauen, kann leer sein)
  • Konvention: Pfad1 entspricht immer dem bevorzugten Bild
Dataset-Beispiel

HPDv3.torrent
Seeding 1Herunterladen 0Abgeschlossen 6Gesamtdownloads 29
  • HPDv3/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • HPDv3.zip
          16.23 GB
HPDv3-Datensatz Zu Menschlichen Präferenzen | Datensätze | HyperAI