HyperAIHyperAI

Command Palette

Search for a command to run...

デンマーク語の攻撃的言葉とヘイトスピーチ検出

Gudbjartur Ingi Sigurbergsson; Leon Derczynski

概要

ソーシャルメディアプラットフォーム上の攻撃的な言葉遣いの存在とその影響は、現代社会における大きな懸念となっています。毎日生成される膨大な量のコンテンツを考えると、この種のコンテンツを検出し対処するためには自動的な方法が必要です。これまでの研究の大半は英語での問題解決に焦点を当てていましたが、この問題は多言語的であることが認識されています。私たちは、\textit{Reddit} および \textit{Facebook} からユーザーが生成したコメントを集めたデンマーク語データセットを作成しました。このデータセットにはさまざまなソーシャルメディアプラットフォームからのユーザー生成コメントが含まれており、当該分野では初めてのものであると認識しています。データセットは、攻撃的な言葉遣いの様々なタイプと対象を捉えるために注釈が付けられています。私たちは4つの自動分類システムを開発し、それぞれが英語とデンマーク語の両方で動作することを目指しました。英語での攻撃的な言葉遣いの検出において、最も高性能なシステムはマクロ平均 F1 スコアで 0.740.740.74 を達成し、デンマーク語では 0.700.700.70 を達成しました。また、攻撃的な投稿が特定の対象を標的にしているかどうかの検出において、英語ではマクロ平均 F1 スコアで 0.620.620.62 を達成し、デンマーク語では 0.730.730.73 を達成しました。最後に、特定の対象を標的にした攻撃的な投稿における対象タイプの検出において、英語ではマクロ平均 F1 スコアで 0.560.560.56 を達成し、デンマーク語では 0.630.630.63 を達成しました。私たちの研究は、英語とデンマーク語双方について攻撃的な言葉遣いのタイプと対象を捉えています。また、ヘイトスピーチやサイバーブリーリングなどの異なる種類の攻撃的な言葉遣いを検出するための自動的方法を提示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
デンマーク語の攻撃的言葉とヘイトスピーチ検出 | 記事 | HyperAI超神経