
摘要
在评论分析的背景下,方面(aspects)是指客户针对产品和服务发表意见和情感的具体特征。方面检测有助于产品所有者和服务提供商识别不足之处并优先考虑客户需求,从而维持收入并减少客户流失。现有的方法主要集中在通过训练监督学习模型来检测方面的表面形式,但在方面隐含于评论中时表现不佳。本文提出了一种无监督方法,用于提取方面的隐含出现。具体而言,我们假设客户在撰写评论时经历了一个两阶段的假设生成过程:(1) 从产品或服务可用的方面集合中选择一个方面;(2) 从语言中所有可用词汇的集合中选择与所选方面更相关的意见词汇进行书写。我们采用潜在狄利克雷分配(latent Dirichlet allocation)来学习生成评论时的隐含方面分布。基准数据集上的实验结果表明,当评论中没有方面的表面形式时,我们提出的方法能够改进现有技术水平。