17일 전
채팅GPT와 GPT-4는 금융 텍스트 분석을 위한 일반 목적의 솔버인가? 몇 가지 대표적 작업에 대한 연구
Xianzhi Li, Samuel Chan, Xiaodan Zhu, Yulong Pei, Zhiqiang Ma, Xiaomo Liu, Sameena Shah

초록
최근의 대규모 언어 모델(Large Language Models, LLMs)인 ChatGPT 및 GPT-4와 같은 모델들은 일반화 모델로서 다양한 자연어 처리(NLP) 과제에서 거의 또는 전혀 적응 없이 최첨단 성능을 달성하는 놀라운 능력을 보여주고 있다. 이러한 모델들이 금융 분야에서는 얼마나 효과적인가? 이 기본적인 질문을 이해하는 것은 다양한 후속 금융 분석 과제에 큰 영향을 미칠 수 있다. 본 논문에서는 금융 텍스트 분석 문제의 다양한 유형에 대해 실험적으로 연구하며, 다섯 가지 과제 범주에서 나온 여덟 개의 벤치마크 데이터셋을 활용하여 이러한 모델들의 성능에 대한 실험적 증거를 제시한다. 현재의 모델들이 최첨단의 태깅된(fine-tuned) 접근법 및 최근에 공개된 도메인 특화 사전 학습 모델과 비교됨에 따라, 그 강점과 한계를 함께 보고한다. 본 연구가 기존 모델들이 금융 분야에서 갖는 능력을 이해하는 데 기여하고, 향후 개선을 촉진하는 데 도움이 되기를 기대한다.