
摘要
本文介绍了AliEdalat团队在SemEval-2022任务4:施惠性与居高临下语言(Patronizing and Condescending Language, PCL)检测中的方法与实验结果。该任务旨在识别文本中PCL的存在及其具体类别,以防止对弱势群体的进一步歧视。我们采用三种基础模型的集成方法来检测PCL的存在:微调后的BigBird、微调后的MPNet以及BERT+BiGRU模型。然而,由于过拟合问题,该集成模型的表现劣于基线模型,F1分数仅为0.3031。为此,我们提出了一种新的解决方案以克服提交模型存在的问题。我们对PCL的不同类别进行独立建模与检测。针对每一类PCL,我们将其视为一个独立的检测任务,采用微调后的RoBERTa模型替代原有的BERT+BiGRU结构。在PCL类别检测任务中,我们的模型表现优于基线模型,取得了0.2531的F1分数。此外,我们还提出了两种针对特定PCL类别的新模型,其性能均优于原始提交的模型。