Command Palette
Search for a command to run...
Nemotron-Personas-USA は、NVIDIA が 2025 年にリリースした大規模な合成ユーザー プロファイル データセットであり、対話生成、ロール シミュレーション、ユーザー モデリング、多様な行動分析などのタスクにおける大規模言語モデル (LLM) とインテリジェント エージェント システムのトレーニングと評価をサポートするように設計されています。
このデータセットには、約100万件の仮想キャラクターレコードが含まれており、合計600万のペルソナフィールドと16のコンテキスト情報フィールドが含まれています。このデータは、アメリカ合衆国全50州、プエルトリコ、およびバージン諸島をカバーし、29,000の地理的郵便番号(ZCTA)と15,200の都市/地域を含み、米国人口の地理的および社会的分布に関する比較的包括的な全体像を提供します。
このデータセットには約97万件の固有名が含まれており、560以上の職業カテゴリーを網羅しています。職業分布は現実世界の職業統計を参照しており、社会的な代表性を確保しています。各データポイントは、年齢、性別、教育水準、収入、職業、居住地などの構造化された人口統計情報に加え、興味、価値観、ライフスタイル、個人的な目標といった自然言語によるペルソナ記述を含む多次元フィールドで構成されており、構造化情報と非構造化テキストを組み合わせた複合的なペルソナ表現を形成しています。
