Ensemble De Données Sur Les Préférences Humaines HPDv3
Date
Taille
URL de publication
URL de l'article
Licence
MIT
HPDv3 a été proposé par l'équipe de recherche Mizzen AI en collaboration avec le Laboratoire Multimédia (MMLab) de l'Université chinoise de Hong Kong, le King's College de Londres et d'autres équipes d'auteurs. Publié en 2025, il constitue le premier ensemble de données de préférences humaines à large spectre couvrant plusieurs domaines. « HPSv3 : Vers un score de préférence humaine à large spectre », et a été sélectionné pour ICCV 2025. Cet ensemble de données vise l'alignement, le réarrangement et l'évaluation des modèles de génération de texte en image, visant à promouvoir les progrès des modèles dans l'approche de l'esthétique humaine et l'amélioration de la cohérence sémantique.
L'ensemble de données contient 1,08 million de paires texte-image et 1,17 million de données de comparaison appariées annotées, couvrant des photos réelles de haute et basse qualité, avec de riches informations d'annotation. L'ensemble d'apprentissage comprend environ 1,14 million d'éléments et l'ensemble de test environ 14 400 éléments, ce qui permet de caractériser un large éventail de préférences humaines.
Les données comprennent :
- Texte : invite (anglais)
- Chemins d'image appariés : chemin1, chemin2 (alignés avec les chemins après décompression du package d'images)
- Sources du modèle : modèle1, modèle2
- Annotation de préférence : choice_dist (distribution des votes, peut être vide), confidence (confiance, peut être vide)
- Convention : path1 correspond toujours à l'image la plus préférée
