HyperAI

Ensemble De Données De Caractères Nemotron-Personas

Date

il y a 12 jours

Organisation

NVIDIA

URL de publication

huggingface.co

Catégories

Aide au téléchargement

Nemotron-Personas est un jeu de données de personnages publié par NVIDIA en 2025. Il contient des personnages synthétisés artificiellement à partir de données démographiques, de répartition géographique et de traits de personnalité réels, afin de saisir la diversité et la richesse de la population. Il s'agit du premier jeu de données de ce type à inclure des statistiques relatives à des attributs tels que le nom, le sexe, l'âge, les origines, l'état civil, le niveau d'études, la profession et le lieu de résidence.

L'ensemble de données comprend :

  • 100 000 enregistrements, contenant 22 champs : 6 champs de personnalité et 16 champs de contexte
  • Environ 54 millions de jetons, dont environ 23,6 millions sont liés aux personnages
  • Couvrant de multiples dimensions, notamment la démographie, la répartition géographique et les traits de personnalité
  • Plus de 560 types d'emplois différents basés sur des données de répartition des emplois dans le monde réel