2달 전

Astock: 주식별 뉴스 분석 모델을 기반으로 한 새로운 데이터셋 및 자동 주식 거래

Jinan Zou; Haiyao Cao; Lingqiao Liu; Yuhao Lin; Ehsan Abbasnejad; Javen Qinfeng Shi
Astock: 주식별 뉴스 분석 모델을 기반으로 한 새로운 데이터셋 및 자동 주식 거래
초록

자연어 처리(Natural Language Processing, NLP)는 소셜 미디어나 뉴스 출처의 텍스트를 분석하여 금융 의사결정을 지원하는 데 큰 잠재력을 보여주고 있습니다. 본 연구에서는 NLP를 활용한 주식 자동 거래 알고리즘을 체계적으로 연구하기 위한 플랫폼을 구축하였습니다. 이전 연구와 달리, 우리의 플랫폼은 세 가지 특징으로 구분됩니다: (1) 각 개별 주식에 대한 금융 뉴스를 제공합니다. (2) 각 주식에 대한 다양한 요인들을 제공합니다. (3) 더 많은 금융 관련 지표를 통해 성능을 평가합니다. 이러한 설계는 우리에게 보다 현실적인 환경에서 NLP를 활용한 주식 자동 거래 알고리즘을 개발하고 평가할 수 있는 기회를 제공합니다.평가 플랫폼과 데이터셋 수집 설계 외에도, 우리는 다양한 입력 정보로부터 좋은 특성 표현을 자동으로 학습할 수 있는 시스템을 제안함으로써 기술적 공헌도 하였습니다. 우리 알고리즘의 핵심은 의미 역할 표시(Semantic Role Labeling, SRL)를 활용하여 각 뉴스 단락의 간결한 표현을 생성하는 방법인 의미 역할 표시 풀링(Semantic Role Labeling Pooling, SRLP)입니다. SRLP 기반으로, 우리는 추가로 다른 주식 요인들을 통합하여 최종 예측을 수행하였습니다. 또한, SRLP 기반의 자기 감독 학습 전략을 제안하여 시스템의 분포 외 일반화 성능을 향상시키고자 하였습니다.실험 연구를 통해 우리는 제안된 방법이 더 우수한 성능을 보임을 입증하였으며, 모든 베이스라인의 연간 수익률 및 CSI300 지수와 XIN9 지수의 실제 거래에서 최대 낙폭(maximum drawdown)보다 우수한 결과를 얻었습니다. 우리의 Astock 데이터셋과 코드는 https://github.com/JinanZou/Astock 에서 확인하실 수 있습니다.