
摘要
十多年来,机器学习一直被用于从文本中提取意见持有者-目标结构,以回答“谁对什么表达了什么样的情感?”这一问题。最近的神经网络方法在意见角色标注(Opinion Role Labeling, ORL)方面并未超越最先进的基于特征的模型。我们怀疑这是由于标记训练数据的稀缺性所致,并通过使用不同的多任务学习(Multi-Task Learning, MTL)技术来解决这一问题,这些技术利用了具有大量数据的相关任务——即语义角色标注(Semantic Role Labeling, SRL)。我们展示了两种多任务学习模型在开发集和测试集上显著优于单任务模型,无论是对意见持有者的标注还是对目标的标注。我们发现,仅使用共享的ORL和SRL特征进行预测的基本MTL模型表现最佳。通过深入分析,我们确定了哪些方法有效以及可以采取哪些措施进一步改进ORL。