Command Palette
Search for a command to run...
Yi-Fei Liu Yi-Long Lu Di He Hang Zhang

초록
개인 내부의 심리적 구성 요소들은 서로 연결되어 있다는 점이 널리 인정되고 있다. 본 연구에서는 대규모 언어 모델(Large Language Models, LLMs)이 최소한의 정량적 입력만으로 인간의 심리적 특성 간 상관 구조를 어떻게 모델링할 수 있는지 여부와 그 방식을 탐구하였다. 우리는 816명의 인간 피험자들이 제출한 '빅파이브 성격 척도(Big Five Personality Scale)' 응답을 기반으로, 다양한 LLMs에 다른 9개의 심리척도에 대한 응답을 역할 수행하도록 유도하였다. 그 결과, LLMs는 인간 심리 구조를 놀랄 만큼 정확하게 포착하였으며, LLM이 생성한 응답 간 척도 간 상관 패턴은 실제 인간 데이터에서 관찰된 패턴과 매우 강하게 일치하였다. 이러한 제로샷(zero-shot) 성능은 의미 유사성 기반 예측을 크게 초월하였으며, 원 데이터에 직접 학습된 머신러닝 알고리즘의 정확도에 근접하였다. 추론 경로 분석을 통해 LLMs가 체계적인 두 단계 프로세스를 활용한다는 것이 밝혀졌다. 첫 번째 단계에서는 원시적인 빅파이브 응답을 정보 선택과 압축을 통해 자연어 기반의 성격 개요로 변환하며, 이는 충분통계량(sufficient statistics) 생성과 유사한 과정이다. 두 번째 단계에서는 이러한 요약 정보를 바탕으로 타겟 척도의 응답을 추론하여 생성한다. 정보 선택 측면에서 LLMs는 훈련된 알고리즘이 식별하는 것과 동일한 핵심 성격 요인을 파악하지만, 요인 내 항목 간 중요도의 차이를 구분하지는 못한다. 생성된 압축된 요약은 단순한 반복적 표현이 아니라, 상호보완적 정보를 포착한다. 기존 점수에 이 요약 정보를 추가하면 예측 일치도가 향상되며, 이는 이러한 요약이 특성 간 상호작용의 융합적이고 이차적 패턴(second-order patterns)을 인코딩하고 있음을 시사한다. 본 연구 결과는 LLMs가 추상화와 추론 과정을 통해 극히 제한된 데이터로부터 개인의 심리적 특성을 정밀하게 예측할 수 있음을 보여주며, 심리학적 시뮬레이션을 위한 강력한 도구로서의 가능성을 제시함과 동시에, LLMs의 타당한 추론 능력에 대한 귀중한 통찰을 제공한다.