11 天前

DH-FBK 参与 SemEval-2022 任务 4:利用标注者分歧与多数据视角进行奉承语言检测

{Elisa Leonardelli, Alan Ramponi}
DH-FBK 参与 SemEval-2022 任务 4:利用标注者分歧与多数据视角进行奉承语言检测
摘要

在面向大众的媒体内容中,微妙且通常无意识使用的居高临下、轻蔑贬低的语言(Patronizing and Condescending Language, PCL)会不恰当地强化刻板印象,巩固权力—知识关系,从而持续加剧对弱势群体的歧视。由于PCL具有高度主观性和隐蔽性,其检测对计算方法和人工标注者而言均是一项开放且极具挑战性的任务。本文介绍了DH-FBK团队在SemEval-2022任务4中的参赛系统,该任务旨在识别英文媒体文本中针对弱势群体的PCL。受人类判断主观性启发,我们提出利用标注者之间的不确定性和分歧,在多任务、多视角学习框架下更精准地捕捉PCL的细微差异。所提出的方法取得了具有竞争力的性能表现,在PCL识别与分类两个子任务上均显著优于基线模型,并在排行榜上位居左上区域。值得注意的是,该方法无需依赖任何外部数据或模型集成,因而具备良好的实用性与可部署性,为现实场景中的PCL检测提供了一种可行且具吸引力的解决方案。