
要約
主観的バイアス検出は、プロパガンダ検出、コンテンツ推薦、センチメント分析、バイアスの中立化といった応用において重要である。このようなバイアスは、誹謗的な語句や表現、事実に対する疑念の提示、前提的な真実の仮定といった形で自然言語に組み込まれる。本研究では、Wikipediaの編集データから主観的バイアスの削除例を収集した「Wiki Neutrality Corpus(WNC)」を用いて、BERTベースのモデルによる主観的バイアス検出に関する包括的な実験を実施した。このデータセットは36万件のラベル付きインスタンスを含む。さらに、BERTベースのアンサンブル手法を提案し、従来の最先端手法であるBERT_{large}を5.6のF1スコアの差で上回ることに成功した。