2ヶ月前
オープンドメイン質問応答における答えの再ランキングのための証拠集約
Shuohang Wang; Mo Yu; Jing Jiang; Wei Zhang; Xiaoxiao Guo; Shiyu Chang; Zhiguo Wang; Tim Klinger; Gerald Tesauro; Murray Campbell

要約
最近のオープンドメイン質問への回答手法として、まず質問に関連する文章を検索し、その後読み取り理解モデルを適用して回答を抽出することが人気となっています。既存の方法は通常、各文章から独立して回答を抽出します。しかし、一部の質問には異なる情報源からの証拠を組み合わせる必要があるため、正しく回答するために複数の文章を利用することが求められます。本論文では、複数の文章を使用して回答を生成する2つのモデルを提案します。これらは、既存の最先端QA(Question Answering)モデルによって生成された回答候補を再順位付けするアプローチを使用しています。我々は、強度に基づく再順位付け(strength-based re-ranking)とカバレッジに基づく再順位付け(coverage-based re-ranking)という2つの方法を提案し、異なる文章から集約された証拠を利用してより適切な回答を決定します。我々のモデルは、Quasar-T、SearchQAおよびTriviaQAのオープンドメイン版という3つの公開オープンドメインQAデータセットで最先端の結果を達成しており、前二者のデータセットにおいて約8パーセンテージポイントの改善が見られています。