Nemotron-Personas 캐릭터 데이터 세트
네모트론-페르소나(Nemotron-Personas)는 엔비디아가 2025년에 공개한 캐릭터 데이터셋입니다. 실제 인구 통계, 지리적 분포, 그리고 성격 특성을 기반으로 인공적으로 합성된 캐릭터를 포함하고 있으며, 인구의 다양성과 풍요로움을 포착하는 것을 목표로 합니다. 이름, 성별, 나이, 배경, 결혼 여부, 교육, 직업, 거주지 등의 속성 관련 통계를 포함하는 최초의 데이터셋입니다.
데이터 세트에는 다음이 포함됩니다.
- 22개 필드를 포함하는 100,000개 레코드: 6개의 페르소나 필드와 16개의 컨텍스트 필드
- 약 5,400만 개의 토큰이 있으며, 그 중 약 2,360만 개가 캐릭터 관련 토큰입니다.
- 인구 통계, 지리적 분포 및 성격 특성을 포함한 다양한 차원을 포괄합니다.
- 실제 직업 분포 데이터를 기반으로 560개 이상의 다양한 직업 유형