Command Palette
Search for a command to run...
表に基づく事実確認と注目度を考慮した学習
表に基づく事実確認と注目度を考慮した学習
Fei Wang; Kexuan Sun; Jay Pujara; Pedro Szekely; Muhao Chen
概要
表は、文章の主張を検証するために使用できる貴重な知識を提供します。多くの研究が表に基づく事実検証を考慮していますが、表データと文章内のトークンとの直接的な対応関係はほとんど利用できません。さらに、汎用的事実検証モデルの学習には豊富なラベル付き訓練データが必要です。本論文では、これらの問題を解決する新しいシステムを提案します。反事実因果性に着想を得て、当システムはプロービングベースの重要度推定により、文章内のトークンレベルでの重要度を識別します。重要度推定は、事実検証の学習を2つの観点から強化します。1つの観点では、当システムはマスクされた重要なトークン予測を行い、表と文章との間の対応と推論のためのモデルを強化します。もう1つの観点では、当システムは非重要な用語を置き換えることでより多様な訓練インスタンスセットを生成する重要度認識型データ拡張を行います。TabFactにおける実験結果は、提案した重要度認識型学習技術による効果的な改善を示しており、ベンチマークにおいて新たな最先端(SOTA)性能につながっています。私たちのコードは公開されており、https://github.com/luka-group/Salience-aware-Learning で入手可能です。注:「SOTA」(State Of The Art)は、「最先端」と訳しました。「luka-group」および「Salience-aware-Learning」についてはそのまま使用し、URLもそのまま記載しました。