14日前

リーズニングチェーンを用いたマルチホップ質問応答

Jifan Chen, Shih-ting Lin, Greg Durrett
リーズニングチェーンを用いたマルチホップ質問応答
要約

マルチホップ質問応答(multi-hop question answering)は、文章の異なる部分から情報を収集して質問に答えることを要求する。現在の大多数のアプローチは、ニューラルネットワークを用いてエンド・ツー・エンドでこのタスクを学習するが、推論プロセスの明示的な表現を維持しない。本研究では、回答に至る一連の文からなる離散的な推論チェーンを文章から抽出する手法を提案する。その後、抽出されたチェーンをBERTベースの質問応答モデルに投入し、最終的な回答を予測する。重要な点として、訓練時には真のラベル付きチェーンや「サポートファクト(supporting facts)」に依存せず、固有表現認識(named entity recognition)および共参照解決(coreference resolution)に基づくヒューリスティックを用いて擬似真の推論チェーンを生成している。また、テスト時にもこれらのラベルに依存せず、モデルは生のテキストからチェーンを抽出する能力を学習する。本手法は、最近提案された大規模なマルチホップQAデータセットであるWikiHopおよびHotpotQAで評価され、WikiHopでは最先端の性能を達成し、HotpotQAでも優れた性能を示した。分析の結果、高い性能を発揮するためのチェーンの特性が明らかになった。特に、抽出を逐次的にモデリングすることが重要であり、各候補文を文脈に応じた方法で処理することが不可欠であることが示された。さらに、人間による評価では、抽出されたチェーンを用いることで人間が高い自信を持って回答を導くことができたことから、これらのチェーンが本タスクにおける強力な中間抽象化(intermediate abstraction)であることが示された。

リーズニングチェーンを用いたマルチホップ質問応答 | 最新論文 | HyperAI超神経