1ヶ月前
神経、統計的、および外部特徴を組み合わせた偽ニュース識別の利点
Gaurav Bhatt; Aman Sharma; Shivam Sharma; Ankush Nagpal; Balasubramanian Raman; Ankush Mittal

要約
ニュース記事の真偽を特定することは興味深い問題であり、このプロセスを自動化することは困難な課題である。フェイクニュースの検出は依然として未解決の問題であり、これは現行の最先端モデルが多くの要因を取り入れられていないことに依存している。本論文では、フェイクニュース識別におけるサブタスクである立場検出に焦点を当てる。与えられたニュース記事に対して、本文とその主張の関連性を判定するタスクである。私たちは、神経系、統計的、および外部特徴量を組み合わせてこの問題に対する効率的な解決策を提供する新規アイデアを提案する。深層再帰型モデルから神経埋め込み(neural embedding)を計算し、重み付きn-gram バッグオブワーズモデルから統計的特徴量を抽出し、特徴量エンジニアリングのヒューリスティックを使用して手作業で外部特徴量を作成する。最後に、深層ニューラル層を使用してすべての特徴量を結合し、見出しと本文のニュースペアを同意(agree)、不同意(disagree)、議論(discuss)、または無関係(unrelated)に分類する。私たちは提案手法をフェイクニュースチャレンジデータセット上の現行最先端モデルと比較した。広範な実験を通じて、提案モデルがフェイクニュースチャレンジへの提出も含むすべての最先端技術を超えることが確認された。