11 天前

基于上下文分隔符的在线话语中的讽刺检测

Kartikey Pant, Tanvi Dadu
基于上下文分隔符的在线话语中的讽刺检测
摘要

讽刺是一种复杂的言语表达形式,其含义往往通过隐含方式传递。作为一种高度复杂的表达方式,讽刺的识别极具挑战性。讽刺识别的困难容易导致日常交流中的误解,这也促使学术界对自动化讽刺检测的关注日益增加。在第二届隐喻语言处理(Figurative Language Processing, FigLang 2020)研讨会上,讽刺检测共享任务发布了两个数据集,分别从Twitter和Reddit平台采集了带有上下文的回复文本。在本研究中,我们采用RoBERTa_large模型对这两个数据集中的讽刺文本进行检测。为进一步验证上下文在提升基于上下文词嵌入模型性能方面的重要性,我们设计了三种不同类型的输入形式:仅回复(Response-only)、上下文-回复(Context-Response)以及上下文-回复分隔形式(Context-Response (Separated))。实验结果表明,我们提出的模型架构在两个数据集上均表现出具有竞争力的性能。此外,我们还发现,在上下文与目标回复之间加入分隔标记(separation token)可使Reddit数据集的F1分数提升5.13%,显著增强了模型对讽刺语义的捕捉能力。

基于上下文分隔符的在线话语中的讽刺检测 | 最新论文 | HyperAI超神经