
摘要
现有的机器学习技术在基于文本的分类任务中已经接近人类的表现。然而,聊天数据中存在的多模态噪声(如表情符号、俚语、拼写错误、代码混合数据等)使得现有的深度学习解决方案表现不佳。深度学习系统无法稳健地捕捉这些协变量,限制了其性能。我们提出了一种名为NELEC(神经和词汇组合器)的系统,该系统优雅地结合了文本和基于深度学习的方法来进行情感分类。我们在SemEval-2019的“文本中的情境情感检测”第三任务中对我们的系统进行了评估。结果表明,我们的系统显著优于基线系统以及我们自己的深度学习模型基准。它在测试集排行榜上取得了0.7765的微平均F1分数,排名第三。我们的代码已发布在https://github.com/iamgroot42/nelec。