3ヶ月前
質問応答システムにおける意味検索のためのマルチタスク文エンコーディングモデル
Qiang Huang, Jianhui Bu, Weijian Xie, Shengwen Yang, Weijia Wu, Liping Liu

要約
質問応答(QA)システムは、ユーザーの質問に対して自動的に適切な回答を提供するために用いられる。QAシステムにおける文の一致検出は重要なタスクであり、通常は類義表現同定(Paraphrase Identification: PI)問題として再定式化される。与えられた質問に対して、このタスクの目的はQA知識ベース内から最も類似した質問を特定することにある。本論文では、PI問題に対応するためのマルチタスク文表現モデル(Multi-task Sentence Encoding Model: MSEM)を提案する。本モデルでは、文間の関係を連結グラフで表現し、マルチタスク学習モデルを用いて文の一致検出および文の意図分類の両方の問題を同時に処理する。さらに、提案モデルと近似最近傍(Approximate Nearest Neighbor: ANN)技術を統合した汎用的な意味的検索フレームワークを実装しており、オンラインサービスにおいて、利用可能なすべての候補から最も類似した質問を極めて高速に検索することが可能となる。実験の結果、既存の文一致モデルと比較して、本手法の優位性が確認された。