2ヶ月前

デンマーク語の攻撃的言葉とヘイトスピーチ検出

Gudbjartur Ingi Sigurbergsson; Leon Derczynski

要約

ソーシャルメディアプラットフォーム上の攻撃的な言葉遣いの存在とその影響は、現代社会における大きな懸念となっています。毎日生成される膨大な量のコンテンツを考えると、この種のコンテンツを検出し対処するためには自動的な方法が必要です。これまでの研究の大半は英語での問題解決に焦点を当てていましたが、この問題は多言語的であることが認識されています。私たちは、\textit{Reddit} および \textit{Facebook} からユーザーが生成したコメントを集めたデンマーク語データセットを作成しました。このデータセットにはさまざまなソーシャルメディアプラットフォームからのユーザー生成コメントが含まれており、当該分野では初めてのものであると認識しています。データセットは、攻撃的な言葉遣いの様々なタイプと対象を捉えるために注釈が付けられています。私たちは4つの自動分類システムを開発し、それぞれが英語とデンマーク語の両方で動作することを目指しました。英語での攻撃的な言葉遣いの検出において、最も高性能なシステムはマクロ平均 F1 スコアで $0.74$ を達成し、デンマーク語では $0.70$ を達成しました。また、攻撃的な投稿が特定の対象を標的にしているかどうかの検出において、英語ではマクロ平均 F1 スコアで $0.62$ を達成し、デンマーク語では $0.73$ を達成しました。最後に、特定の対象を標的にした攻撃的な投稿における対象タイプの検出において、英語ではマクロ平均 F1 スコアで $0.56$ を達成し、デンマーク語では $0.63$ を達成しました。私たちの研究は、英語とデンマーク語双方について攻撃的な言葉遣いのタイプと対象を捉えています。また、ヘイトスピーチやサイバーブリーリングなどの異なる種類の攻撃的な言葉遣いを検出するための自動的方法を提示しています。