
要約
ヘイトスピーチ検出モデルにおいて、検出性能以外にも、バイアスと説明可能性という2つの重要な側面を考慮する必要がある。ヘイトスピーチは特定の語彙の存在のみによって判断できるものではなく、モデルは人間のように推論でき、かつその判断根拠を説明可能な状態でなければならない。これらの側面における性能向上を図るため、本研究では中間タスクとして「マスクされた理由付け予測(Masked Rationale Prediction: MRP)」を提案する。MRPは、周囲のトークンと未マスクされた理由付け(人間の判断根拠となる文の断片)を参照しながら、マスクされた人間の理由付けを予測するタスクである。MRPを通じてモデルが理由付けに基づいた推論能力を学習することで、バイアスや説明可能性の観点からも、ヘイトスピーチ検出において堅牢な性能を発揮する。提案手法は、さまざまな評価指標において一般的に最先端の性能を達成しており、ヘイトスピーチ検出における有効性が示された。