2 个月前

一种用于识别英语混码文本和单语文本中攻击行为的统一系统

Anant Khandelwal; Niraj Kumar
一种用于识别英语混码文本和单语文本中攻击行为的统一系统
摘要

社交媒体平台的广泛使用增加了攻击性的风险,这导致了心理压力,并对人们的生活产生了负面影响,如心理痛苦、攻击行为和对他人的不尊重。大多数此类对话包含混合编码语言[28]。此外,表达思想的方式或沟通风格在不同的社交媒体平台上也有所不同(例如,Twitter 和 Facebook 的沟通风格不同)。这些因素都增加了问题的复杂性。为了解决这些问题,我们引入了一种统一且强大的多模态深度学习架构,该架构既适用于英语混合编码数据集,也适用于单语英语数据集。所设计的系统采用了心理语言学特征和非常基础的语言学特征。我们的多模态深度学习架构包括深层金字塔卷积神经网络(Deep Pyramid CNN)、池化双向长短期记忆网络(Pooled BiLSTM)以及断开连接的递归神经网络(Disconnected RNN),后者同时使用了 Glove 和 FastText 嵌入。最终,系统根据模型平均的结果做出决策。我们在英语混合编码 TRAC 2018 数据集和从 Kaggle 获得的单语英语数据集上评估了我们的系统。实验结果表明,我们提出的系统在这两类数据集上的表现均优于所有先前的方法。

一种用于识别英语混码文本和单语文本中攻击行为的统一系统 | 最新论文 | HyperAI超神经