2ヶ月前
PullNet: オープンドメインの質問応答における知識ベースとテキストの反復検索
Haitian Sun; Tania Bedrax-Weiss; William W. Cohen

要約
私たちは、コーパスや知識ベース(KB)から、またはこれら両方の組み合わせから答えを導き出すオープンドメインの質問応答(QA)について検討します。特に、大規模だが不完全なKBがコーパスを補完する設定に焦点を当て、非自明的な(例えば、「マルチホップ」)推論が必要な質問に注目します。ここでは、PullNetという統合フレームワークについて説明します。このフレームワークは、(1) どの情報を取得すべきか(KBと/またはコーパスから)学習し、(2) この異種情報を使って最適な答えを見つけるための推論を行うことを目的としています。PullNetは反復プロセスを使用して、質問に関連する情報を含む質問固有のサブグラフを構築します。各反復において、グラフ畳み込みネットワーク(グラフCNN)が使用され、コーパスと/またはKBからの取得(または「プル」)操作によって拡張すべきサブグラフのノードを特定します。サブグラフが完成したら、同様のグラフCNNが使用されてサブグラフから答えが抽出されます。この取得と推論のプロセスにより、大規模なKBやコーパスを使用してマルチホップ質問に回答することが可能になります。PullNetは弱教師ありで学習され、質問-答えペアが必要ですが金標準推論パスは必要ありません。実験結果では、PullNetは既存の最先端技術よりも優れており、特にコーパスと不完全なKBを組み合わせて使用する設定では大幅な改善が見られます。また、KBのみを使用する設定やテキストのみを使用する設定でも、PullNetはしばしば既存システムより優れています。