2ヶ月前
BEIKE NLP at SemEval-2022 Task 4: Prompt-Based Paragraph Classification for Patronizing and Condescending Language Detection BEIKE NLPのSemEval-2022タスク4:上から目線および屈折的な言葉遣い検出のためのプロンプトベース段落分類
Yong Deng; Chenxiao Dou; Liangyu Chen; Deqiang Miao; Xianghui Sun; Baochang Ma; Xiangang Li

要約
PCL検出タスクは、一般的なメディアで脆弱なコミュニティに対して屈折的または高慢な言葉遣いを特定し、分類することを目指しています。他の段落分類のNLPタスクと比較して、PCL検出タスクで提示される否定的な言語は通常、より暗示的かつ微妙であり、認識が困難であるため、一般的なテキスト分類手法の性能は期待外れとなることが多いです。本稿では、SemEval-2022 Task 4におけるPCL検出問題に焦点を当て、私たちのチームが提案した解決策について紹介します。この解決策では、プロンプトベース学習の力を活用し、段落分類タスクを適切な穴埋めプロンプトとして再定式化し、事前学習済みマスク言語モデルを使用して穴埋めスロットを補完します。二値分類と多ラベル分類という2つのサブタスクにおいて、DeBERTaモデルが採用され微調整が行われて特定のタスクプロンプトのマスクされたラベル語を予測します。評価データセットにおいて、二値分類ではF1スコア0.6406を達成しました;多ラベル分類ではマクロF1スコア0.4689を達成し、リーダーボードで1位となりました。