2ヶ月前

粗粒度細粒度共注意ネットワークを用いた多証拠質問応答

Victor Zhong; Caiming Xiong; Nitish Shirish Keskar; Richard Socher
粗粒度細粒度共注意ネットワークを用いた多証拠質問応答
要約

端から端までのニューラルモデルは質問応答において著しい進歩を遂げていますが、最近の研究ではこれらのモデルが単一の文書内で答えと証拠が近接して現れることを暗黙的に前提としていることが示されています。本研究では、複数の文書にわたる証拠情報を組み合わせる新しい質問応答モデルである粗粒度細粒度共注意ネットワーク(Coarse-grain Fine-grain Coattention Network: CFC)を提案します。CFCは、クエリに対して文書を解釈し関連する答えを見つける粗粒度モジュールと、すべての文書における候補となる答えの出現頻度をクエリと比較して各候補答えのスコアを算出する細粒度モジュールで構成されています。これらのモジュールは、共注意と共自分注意の階層を使用して設計されており、入力の異なる部分を強調することを学習します。Qangaroo WikiHop多証拠質問応答タスクにおいて、CFCは盲検テストセットで70.6%という新たな最先端結果を得ており、事前学習済みコンテキストエンコーダーを使用していないにもかかわらず、これまでの最高精度よりも3%高い性能を達成しています。

粗粒度細粒度共注意ネットワークを用いた多証拠質問応答 | 最新論文 | HyperAI超神経