Ensemble De Données Sur Les Préférences Humaines HelpSteer3
Date
Taille
URL de publication
URL de l'article
Licence
CC BY 4.0
HelpSteer3 est un ensemble de données sur les préférences humaines publié par NVIDIA en 2025. Les résultats de l'article associé sont «HelpSteer3-Preference : données de préférences annotées par des humains ouvertes pour diverses tâches et langues", qui vise à améliorer la réactivité du modèle aux invites des utilisateurs grâce à des techniques de rétroaction humaine et d'apprentissage par renforcement.
L'ensemble de données contient 40 476 échantillons de préférences, chacun incluant un domaine, une langue, un contexte, deux réponses, un score de préférence global entre les deux réponses et les scores de préférence personnelle de trois annotateurs maximum. Il inclut des données multilingues (chinois, coréen, français, espagnol, japonais, allemand, russe, portugais, italien, vietnamien et néerlandais).