Nemotron-Personas キャラクターデータセット
Nemotron-Personasは、NVIDIAが2025年にリリースしたキャラクターデータセットです。現実世界の人口統計、地理的分布、性格特性に基づいて人工的に合成されたキャラクターが含まれており、人口の多様性と豊かさを捉えることを目的としています。名前、性別、年齢、経歴、婚姻状況、学歴、職業、居住地などの属性に関する統計情報を備えた、この種のデータセットとしては初のものです。
データセットには次のものが含まれます。
- 100,000件のレコード、22のフィールドを含む:6つのペルソナフィールドと16のコンテキストフィールド
- 約5,400万トークン、そのうち約2,360万はキャラクター関連
- 人口統計、地理的分布、性格特性など、複数の側面をカバー
- 実際の雇用分布データに基づく 560 種類以上の職種