17日前
HopRetriever:Wikipediaを介してホップを検索して複雑な質問に回答する
Shaobo Li, Xiaoguang Li, Lifeng Shang, Xin Jiang, Qun Liu, Chengjie Sun, Zhenzhou Ji, Bingquan Liu

要約
大規模なテキストコーパス(例:Wikipedia)からオープンドメイン質問応答(QA)のための支援証拠を収集することは、大きな課題である。特に、マルチホップオープンドメインQAでは、散在する複数の証拠情報を統合して答えの抽出を支援する必要がある。本論文では、複雑な質問応答に必要な隠れた推論証拠をWikipediaから収集するための新しいリトリーバルターゲット「ホップ(hop)」を提案する。具体的には、本研究における「ホップ」とは、あるハイパーリンクとその対応するアウトバウンドリンク文書の組み合わせとして定義される。ハイパーリンクは、そのアウトバウンドリンク対象エンティティがテキスト文脈内でどのように言及されているかをモデル化する「メンション埋め込み(mention embedding)」として符号化され、対応するアウトバウンドリンク文書は、その中にある非構造化知識を表す「文書埋め込み(document embedding)」として符号化される。このようにして、Wikipedia上でホップを検索することで複雑な質問に答えるための「HopRetriever」を構築した。HotpotQAデータセットにおける実験結果から、HopRetrieverは従来発表された証拠リトリーバル手法と比較して大幅に優れた性能を示した。さらに、本手法は証拠収集プロセスに対する定量的な解釈を可能にするという利点も有している。