1ヶ月前

類似性特徴と深層表現学習を組み合わせたフェイクニュース検出における立場検出

Luís Borges; Bruno Martins; Pável Calado
類似性特徴と深層表現学習を組み合わせたフェイクニュース検出における立場検出
要約

現在、フェイクニュースは高品質なジャーナリズムや情報に基づいた公共の議論に対する潜在的な脅威として急増しており、重要な課題となっています。2017年に組織された「フェイクニュースチャレンジ(FNC-1)」は、立場検出(つまり、特定のニュース記事が特定のニュースヘッドラインに賛成するか、反対するか、議論するか、または関連がないかを識別すること)に向けた機械学習ベースの分類システムの開発を促進することを目的としていました。本稿では、効率的なテキスト表現学習、文書分類、および自然言語推論の文脈で以前に提案されたアイデアを利用した深層ニューラルアーキテクチャと文字列類似度特徴量を組み合わせた新しいアプローチを提案し、この立場検出問題に対処します。具体的には、双方向再帰型ニューラルネットワーク(Bi-RNN)、時間的/順序的な次元での最大プーリング(max-pooling)、およびニューラル注意機構を使用して、(i) ヘッドライン、(ii) ニュース記事の最初の2文、(iii) 全てのニュース記事を表現します。これらの表現はその後結合/比較され、他のFNC-1アプローチから着想を得た類似度特徴量が補完され、最終層で記事がヘッドラインに対してどのような立場であるかを予測します。また、自然言語推論手法の訓練と評価のために当初提案された大規模な文ペアデータセットなどの外部情報源も探索しています。これにより、文を符号化するために使用されるRNNなど、ニューラルネットワークアーキテクチャの特定コンポーネントを事前学習することが可能になります。得られた結果は提案されたアイデアの有効性を証明し、特に事前学習とニューラル表現と類似度特徴量の組み合わせを考えると、当該モデルは従来の最先端技術を超える性能を示しています。

類似性特徴と深層表現学習を組み合わせたフェイクニュース検出における立場検出 | 最新論文 | HyperAI超神経