2 个月前

Astock:基于股票特定新闻分析模型的新数据集和自动化股票交易

Jinan Zou; Haiyao Cao; Lingqiao Liu; Yuhao Lin; Ehsan Abbasnejad; Javen Qinfeng Shi
Astock:基于股票特定新闻分析模型的新数据集和自动化股票交易
摘要

自然语言处理(NLP)在通过分析社交媒体或新闻来源的文本以支持金融决策方面展现出巨大潜力。在这项工作中,我们构建了一个平台,系统地研究基于NLP的股票自动交易算法。与以往的研究相比,我们的平台具有三个特点:(1)为每只特定股票提供金融新闻;(2)为每只股票提供多种股票因子;(3)从更多与金融相关的指标来评估性能。这种设计使我们能够在更加真实的环境中开发和评估基于NLP的股票自动交易算法。除了设计评估平台和数据集收集外,我们还通过提出一个系统来自动学习各种输入信息的良好特征表示,做出了技术贡献。我们的算法的关键在于一种称为语义角色标注池化(Semantic Role Labeling Pooling, SRLP)的方法,该方法利用语义角色标注(SRL)创建每个新闻段落的紧凑表示。基于SRLP,我们进一步结合其他股票因子进行最终预测。此外,我们提出了一种基于SRLP的自监督学习策略,以增强系统的分布外泛化性能。通过实验研究,我们展示了所提出的 方法在实际交易中不仅表现更好,而且其年化收益率超过了所有基线方法,并且最大回撤率低于沪深300指数和XIN9指数。我们的Astock数据集和代码可在https://github.com/JinanZou/Astock 获取。