HyperAIHyperAI

Ensemble De Données d'alignement Des Préférences Humaines CA‑1

Date

il y a un mois

Organisation

OpenAI

URL de publication

huggingface.co

Licence

CC BY 4.0

Aide au téléchargement

*Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

CA‑1, abréviation de Collective Alignment 1, a été publié par OpenAI en 2025. Il se concentre sur les jugements de valeur et les préférences humaines concernant les comportements par défaut des modèles d'IA. Il s'agit d'un ensemble de données comportementales basées sur le retour d'information humain, combinant contenu généré par le modèle et évaluations d'annotateurs.

L'ensemble de données comprend 1 078 éléments de comparaison rapide et 18 384 évaluations fournies par 1 012 annotateurs, ainsi que des informations démographiques et une justification de la notation. Il est adapté à l'étude des différences d'alignement entre groupes, à l'orientation des normes de comportement des modèles et au développement de mécanismes de récompense sensibles à la valeur.

Composition des données :

  • Comparaisons d’invites : Chaque élément contient une invite synthétique et quatre réponses candidates correspondantes (A–D), qui sont utilisées pour comparer les différences de préférences de valeur entre différentes réponses.
  • Annotateurs : ceci enregistre les informations démographiques de base de chaque annotateur, y compris l'âge, le sexe, le niveau d'éducation et le pays d'origine, pour analyser les différences de préférences de valeurs entre différents groupes de personnes.
  • Comparaisons fusionnées – Annotateurs : cela combine les invites, les réponses des candidats et les évaluations des annotateurs, ainsi que des informations contextuelles sur les annotateurs, pour créer une carte invite-réponse-évaluation-démographie complète.