HPDv3-Datensatz Zu Menschlichen Präferenzen
Datum
Größe
Veröffentlichungs-URL
Paper-URL
Lizenz
MIT
HPDv3 wurde vom Mizzen AI-Forschungsteam in Zusammenarbeit mit dem Multimedia Laboratory (MMLab) der Chinesischen Universität Hongkong, dem King's College London und anderen Autorenteams vorgeschlagen. Es wurde 2025 veröffentlicht und ist der erste breit gefächerte Datensatz menschlicher Präferenzen für mehrere Bereiche. „HPSv3: Auf dem Weg zu einem breitbandigen menschlichen Präferenzscore“und wurde für ICCV 2025 ausgewählt. Dieser Datensatz zielt auf die Ausrichtung, Neuanordnung und Bewertung von Text-zu-Bild-Generierungsmodellen ab und soll den Fortschritt der Modelle bei der Annäherung an die menschliche Ästhetik und der Verbesserung der semantischen Konsistenz fördern.
Der Datensatz enthält 1,08 Millionen Text-Bild-Paare und 1,17 Millionen kommentierte Paarvergleichsdaten, die hochwertige und minderwertige reale Fotos mit umfangreichen Anmerkungsinformationen abdecken. Der Trainingssatz umfasst ungefähr 1,14 Millionen Elemente und der Testsatz ungefähr 14.400 Elemente, was zur Charakterisierung eines breiten Spektrums menschlicher Vorlieben geeignet ist.
Die Daten umfassen:
- Text: prompt (Englisch)
- Gepaarte Bildpfade: Pfad1, Pfad2 (ausgerichtet an den Pfaden nach dem Entpacken des Bildpakets)
- Modellquellen: Modell1, Modell2
- Präferenzannotation: choice_dist (Stimmverteilung, kann leer sein), confidence (Vertrauen, kann leer sein)
- Konvention: Pfad1 entspricht immer dem bevorzugten Bild
