
要約
大規模な聴衆を対象とするメディア報道における、洗練されたかつ通常無自覚な優越的・軽蔑的言語(Patronizing and Condescending Language: PCL)の使用は、ステレオタイプを助長し、権力と知識の関係を強化するなど、脆弱なコミュニティに対する差別を継続的に助長するという不適切な影響を及ぼす。その主観性および微妙さから、PCLの検出は計算的手法および人間のアノテーターの両方にとって未解決かつ困難な課題である。本稿では、SemEval-2022 Task 4に提出されたDH-FBKチームのシステムについて述べる。このタスクは、英語メディアテキストにおける脆弱なコミュニティに対するPCLの検出を目的としている。人間の解釈の主観性に着目し、アノテーターの不確実性や合意の不一致を活用することで、マルチタスク・マルチビュー学習フレームワークにおいてPCLの微妙なニュアンスをより適切に捉える手法を提案する。本手法は、ベースラインを大きく上回る競争力ある性能を達成し、PCLの識別および分類の両タスクにおいてリーダーボードの左上部に位置する成績を収めた。特に注目すべきは、本手法が外部データやモデルアンサンブルを一切用いない点であり、実世界への適用においても実用的かつ魅力的な解決策であることを示している。