18 天前
SemEval-2017任务4中的DataStories:基于深度LSTM与注意力机制的消息级及基于主题的情感分析
{Christos Doulkeridis, Christos Baziotis, Nikos Pelekis}

摘要
本文介绍了两个深度学习系统,它们参加了SemEval-2017任务4“推特情感分析”(Sentiment Analysis in Twitter)的竞赛。我们在所有英语推文子任务中均有参与,涵盖消息级情感极性分类与量化,以及基于话题的情感极性分析。我们的方法基于在大规模推文语料上预训练的词嵌入(word embeddings),并在此基础上采用长短期记忆网络(LSTM)结构,辅以两种不同的注意力机制(attention mechanisms)。此外,我们提出了一种适用于社交网络文本的文本处理工具,能够实现分词(tokenization)、词汇规范化(word normalization)、分段(segmentation)以及拼写纠正(spell correction)等功能。值得注意的是,我们的方法不依赖任何手工设计的特征或情感词典。在子任务A(Subtask A)中,我们取得了第一名(并列)的成绩,在其余子任务中也取得了极具竞争力的结果。本文所使用的词嵌入模型及文本处理工具均已向研究社区公开。