17日前
複雑なオープンドメイン質問への対応を実現する反復的クエリ生成手法
Peng Qi, Xiaowen Lin, Leo Mehr, Zijian Wang, Christopher D. Manning

要約
現在のワンステップ検索・読解型質問応答(QA)システムでは、「『アーマダ』の著者が執筆した小説の中で、スティーブン・スピルバーグによって長編映画化される予定の作品はどれか?」といった質問に答えることが困難である。なぜなら、この種の質問は、欠落しているエンティティ(ここでは著者)に関する明示的な検索可能な手がかりをほとんど含んでいないからである。このような質問に答えるには、複数の推論ステップ(マルチホップ推論)が必要であり、まず欠落しているエンティティ(または関連する事実)に関する情報を収集し、その後、さらに推論を進める必要がある。本研究では、文脈の読解と追加の支援文書の検索を繰り返すことで、オープンドメインのマルチホップ質問に答える「GoldEn(Gold Entity)Retriever」を提案する。従来の不透明で計算コストの高いニューラル検索モデルに依存するのではなく、GoldEn Retrieverは質問と利用可能な文脈をもとに自然言語形式の検索クエリを生成し、既存の情報検索システムを活用して欠落したエンティティを検索する。これにより、事前学習済み言語モデル(例:BERT)を用いないにもかかわらず、オープンドメインにおけるマルチホップ推論に効率的にスケーラブルでありながら、推論プロセスの解釈可能性を維持できる。本手法は、最近提案されたオープンドメインマルチホップQAデータセット「HotpotQA」上で評価され、BERTのような事前学習モデルを用いないにもかかわらず、これまでに発表された最良のモデルを上回る性能を示した。