Command Palette
Search for a command to run...
静的BERT埋め込みを用いた嫌悪発言検出
静的BERT埋め込みを用いた嫌悪発言検出
Gaurav Rajput Narinder Singh punn Sanjay Kumar Sonbhadra Sonali Agarwal
概要
ソーシャルメディアプラットフォームの普及が進む中で、特定の集団の特徴(性別、宗教、民族など)を標的にした差別的・攻撃的な発言(ヘイトスピーチ)が大きな懸念事項となっている。かつては口頭でヘイトスピーチが行われていたが、技術の進展に伴い、現在ではSNSを故意に利用して投稿・共有・コメントなどの形でヘイトスピーチを拡散するケースが増加している。クライストチャーチのモスク銃撃事件や欧米におけるアジア人に対するヘイトクライムなど、多くの事例において、加害者がオンライン上で広がるヘイトテキストに強く影響を受けていることが明らかになっている。現在、AIシステムがこうしたテキストを検出・警告する仕組みが導入されているものの、大きな課題の一つとして、誤検出率(非ヘイトとされる内容をヘイトと誤認する)を低減することにある。これは、表現の自由を損なうことなく、正確にヘイトスピーチを検出できるようにするための鍵となる。本研究では、ETHOSヘイトスピーチ検出データセットを用い、単語埋め込みとしてfastText(FT)、GloVe(GV)、またはFT+GVの組み合わせを用いる代わりに、静的BERT埋め込み(BE)を用いることで、ヘイトスピーチ検出分類器の性能を分析した。広範な実験結果から、ニューラルネットワークがFT、GV、またはFT+GVを用いる場合に比べ、静的BERT埋め込みを用いた場合に高い性能を示すことが確認された。特に、ファインチューニングされたBERTと比較した場合、感度(specificity)という指標において顕著な向上が観察された。