
摘要
基于方面的情感分析(Aspect-Based Sentiment Analysis, ABSA)是自然语言处理(Natural Language Processing, NLP)中的一项重要任务,旨在为文本数据中的特定实体及其相关方面精确地关联情感倾向。本文针对当前ABS A方法存在的若干关键缺陷展开研究,包括方面维度有限、训练数据集存在偏差,以及缺乏全面标注立场(stance-coded)的数据集等问题。首先,我们提出了一种可扩展的MaskedABSA方法,通过在训练句中对方面词进行掩码处理,使模型仅依赖上下文信息进行无偏的情感推断。实验结果表明,该方法在方面词情感分类任务上的准确率显著优于现有最先进方法,这一优势已在SemEval数据集上得到验证。其次,为应对ABS A数据集构建过程中长期存在的训练资源匮乏与人工标注成本高昂等挑战,我们引入了一种创新的弱监督技术,充分利用社交媒体数据集中固有的社区聚类特性。通过应用社区发现算法,我们将社交网络划分为具有同质对立立场的极化群体,从而实现大规模方面级情感分析数据集的自动构建,大幅减少对人工标注的依赖。此外,我们的方法在包含多样化方面与立场的真实极化数据集上进行了验证,充分展示了其有效性与良好的可扩展性。