
摘要
金融情感分析是一项具有挑战性的任务,原因在于该领域的专业语言以及缺乏标注数据。通用模型由于无法有效处理金融背景下的专业语言而表现不佳。我们假设预训练语言模型可以解决这一问题,因为它们需要较少的标注示例,并且可以在特定领域的语料库上进行进一步训练。为此,我们引入了基于BERT的金融领域语言模型FinBERT,以应对金融领域的自然语言处理任务。我们的实验结果表明,在两个金融情感分析数据集上,FinBERT在所有评估指标上均优于当前最先进的方法。我们发现,即使在较小的训练集上仅对模型的部分进行微调,FinBERT仍然能够超越最先进的机器学习方法。