11日前

ペルシャ語のフェイクニュース検証のためのディープコンテントベースモデル

{Arash Sharifi, Mohammad-Reza Feizi-Derakhshi, Zoleikha Jahanbakhsh-Nagadeh}
要約

ソーシャルメディアの発展に伴い、社会的コミュニケーションの形態も変化している。SNSは人間関係の構築や情報の拡散においてポジティブな役割を果たしている一方で、フェイクニュース(デマ)の拡散に最適なプラットフォームとしても機能している。デマは通常時でも緊急時でも社会の安全を脅かす可能性があるため、その拡散初期段階での検出と検証は極めて重要である。これまで多くの研究では、ソーシャルネットワークにおける社会的属性に注目してデマ検出・検証の問題に取り組んできたが、コンテンツ特徴への注目はそれほど進んでいない。実際、デマの社会的・構造的特徴は時間とともに変化するため、初期段階では入手できない。この課題を解決するため、本研究では、ツイッターとテレグラムにおけるペルシャ語のデマを早期に検証するためのコンテンツベースのモデルを提案する。提案モデルは、コンテンツがデマ拡散において果たす重要な役割を示し、意味論的・意図的・構文論的情報を統合することで、各デマ文書に対してより包括的な表現を生成する。まず、ParsBERTと並列CapsNetsを組み合わせたハイブリッドモデルにより、元となるデマ文書の文脈依存的単語埋め込み(contextual word embeddings)を生成する。次に、そのデマ文書の意図的・構文的特徴を抽出し、埋め込みと連結することで、デマ検証に必要な豊かな情報表現を獲得する。実世界のデータセットを用いた実験結果から、本モデルは既存の最先端モデルと比較して、早期デマ検証タスクにおいて顕著な性能向上を示した。さらに、分類器の性能はツイッター上で2%から11%、テレグラムでは5%から23%まで向上した。これらの結果は、コンテンツ情報が限られる状況下でも本モデルの有効性が確認されたことを裏付けている。

ペルシャ語のフェイクニュース検証のためのディープコンテントベースモデル | 最新論文 | HyperAI超神経