2 个月前

贝克NLP在SemEval-2022任务4中的研究:基于提示的段落分类以检测居高临下的语言

Yong Deng; Chenxiao Dou; Liangyu Chen; Deqiang Miao; Xianghui Sun; Baochang Ma; Xiangang Li
贝克NLP在SemEval-2022任务4中的研究:基于提示的段落分类以检测居高临下的语言
摘要

PCL检测任务旨在识别并分类在大众媒体中对弱势群体表现出的居高临下或轻蔑的语言。与其他段落分类的自然语言处理任务相比,PCL检测任务中的负面语言通常更为隐晦和微妙,难以被识别,这使得常见的文本分类方法表现不佳。针对SemEval-2022第4项任务中的PCL检测问题,本文介绍了我们团队的解决方案,该方案利用了基于提示的学习在段落分类中的强大能力。我们将任务重新表述为一个合适的完形填空提示,并使用预训练的掩码语言模型来填充完形填空的位置。对于两个子任务,即二元分类和多标签分类,我们采用了DeBERTa模型并对其进行微调,以预测特定任务提示中的掩码标签词。在评估数据集上,对于二元分类任务,我们的方法达到了0.6406的F1分数;对于多标签分类任务,我们的方法达到了0.4689的宏F1分数,并在排行榜上排名第一。