12日前

汝は憎しみを抱いてはならぬ:オンライン嫌がらせ言語への対抗

{Pawan Goyal, Prajwal Singhania, Animesh Mukherje, Suman Kalyan Maity, Subham Rajgaria, Hardik Tharad, Binny Mathew}
汝は憎しみを抱いてはならぬ:オンライン嫌がらせ言語への対抗
要約

ソーシャルメディアにおける嫌悪コンテンツの拡大は、ますます深刻化している。フェイスブック、ツイッター、グーグルなどは、こうした嫌悪コンテンツに対処するため、さまざまな対策を講じてきたが、その多くは表現の自由の侵害というリスクを伴う。一方、カウンタースピーチ(反論発言)は、表現の自由を損なうことなくオンライン上の嫌悪を抑制する有効な手段として注目されている。したがって、こうしたプラットフォームにとっての代替戦略として、嫌悪コンテンツに対する防御策としてカウンタースピーチの促進を検討することができる。しかし、カウンタースピーチの効果的な普及を実現するためには、オンライン環境におけるカウンタースピーチの動態を深く理解する必要がある。その理解を阻む主な要因は、きめ細かく整備されたデータの不足である。本研究では、YouTubeのコメントデータを用いて、初めてカウンタースピーチ用のデータセットを構築し、公開する。本データセットには、9,438件の手動ラベル付きコメントが含まれており、各コメントがカウンタースピーチかどうかのラベルが付与されている。このデータを基に、初めてカウンタースピーチの言語的構造を厳密に分析する測定研究が可能となった。その分析から、以下のような興味深い知見が得られた:カウンタースピーチコメントは、非カウンタースピーチコメントに比べて「いいね」数が約2倍に達する傾向がある。特定のコミュニティでは、非カウンタースピーチコメントの大多数が嫌悪表現である傾向が見られた。また、カウンタースピーチの種類によって効果が均一ではなく、異なるタイプのカウンタースピーチには効果の差が存在する。さらに、詳細な心理言語学的分析により、カウンタースピーチを投稿するユーザーと非カウンタースピーチを投稿するユーザーの言語的選択に顕著な違いが明らかになった。最後に、本研究ではYouTube動画におけるカウンタースピーチを自動検出可能な機械学習モデル群を構築し、F1スコア0.73の性能を達成した。