17 天前

FABSA:用户评论的基于方面的情感分析数据集

{Aji Ghose, Hassan Tahir, Patrycja Sliwiak, Thomas Metcalfe, Georgia Harrison, Jordan Clive, Georgios Kontonatsios}
摘要

基于方面的情感分析(Aspect-Based Sentiment Analysis, ABSA)旨在自动提取实体的方面(aspect)并分类每个提取方面的情感极性。目前大多数可用的ABSA系统严重依赖人工标注的数据集来训练监督式机器学习模型。然而,构建这类人工标注数据集的过程耗时费力,因此现有的ABSA数据集仅覆盖少数领域,且规模有限。为应对这一挑战,我们提出了FABSA(Feedback ABSA),一个大规模、多领域的ABSA反馈评论数据集。FABSA包含约10,500条来自10个不同领域的评论。我们开展了一系列实验,评估先进深度学习模型在FABSA数据集上的表现。实验结果表明,当在FABSA数据集上训练时,ABSA模型能够实现跨领域的良好泛化能力,且随着训练数据规模的扩大,模型性能进一步提升。FABSA数据集已公开发布,可供学术界和工业界免费使用。