2 个月前

考虑冷启动问题的用户和产品注意力机制用于情感分类

Reinald Kim Amplayo; Jihyeok Kim; Sua Sung; Seung-won Hwang
考虑冷启动问题的用户和产品注意力机制用于情感分类
摘要

在情感分析中,用户/产品信息的使用尤为重要,尤其是对于冷启动用户/产品(cold-start users/products),其评论数量非常有限。然而,当前的模型并未解决这一在评论网站上常见的冷启动问题。本文提出了一种混合上下文情感分类器(Hybrid Contextualized Sentiment Classifier, HCSC),该分类器包含两个模块:(1) 一个快速词编码器,能够返回嵌入了短程和长程依赖特征的词向量;(2) 冷启动感知注意力机制(Cold-Start Aware Attention, CSAA),该机制在对编码后的词向量进行注意力池化时考虑了冷启动问题的存在。HCSC 引入了从相似用户/产品构建的共享向量,在原始独立向量信息不足(即冷启动)时使用这些共享向量。这一决策由频率引导的选择门向量来完成。实验结果表明,尽管 HCSC 的复杂度较低,训练速度更快,但在均方根误差(RMSE)方面,HCSC 在著名数据集上的表现显著优于其他模型。更重要的是,当训练数据稀疏且存在冷启动问题时,我们的模型性能显著优于之前的模型。