Command Palette
Search for a command to run...
Nemotron Personas USA(미국) 성격 데이터 세트
Nemotron-Personas-USA는 NVIDIA가 2025년에 출시한 대규모 합성 사용자 프로필 데이터 세트로, 대화 생성, 역할 시뮬레이션, 사용자 모델링, 다양한 행동 분석과 같은 작업에서 대규모 언어 모델(LLM)과 지능형 에이전트 시스템의 훈련과 평가를 지원하도록 설계되었습니다.
이 데이터 세트에는 약 100만 개의 가상 캐릭터 레코드가 포함되어 있으며, 총 600만 개의 페르소나 필드와 16개의 상황 정보 필드가 있습니다. 이 데이터는 미국 50개 주 전체와 푸에르토리코, 버진아일랜드를 포함하며, 29,000개의 우편번호(ZCTA)와 15,200개의 도시/지역을 포함하여 미국 인구의 지리적 및 사회적 분포에 대한 비교적 완전한 그림을 제공합니다.
이 데이터 세트는 약 97만 개의 고유 이름을 포함하고 있으며 560개 이상의 직업 범주를 포괄합니다. 직업 분포는 실제 직업 통계를 참조하여 우수한 사회적 대표성을 보장합니다. 각 데이터 포인트는 연령, 성별, 교육 수준, 소득, 직업, 위치와 같은 구조화된 인구 통계 정보와 관심사, 가치관, 라이프스타일, 개인 목표와 같은 자연어 페르소나 설명을 포함하는 다차원 필드로 구성되어 구조화된 정보와 비구조화된 텍스트를 결합한 복합 페르소나 표현을 형성합니다.
