
要約
検索エンジンの検索効果を向上させるための一つの手法は、文書に関連するまたはその内容を代表する用語で文書を拡張することである。質問応答システムの観点から見れば、これは文書が潜在的に回答できる質問を含む可能性がある。この観察に基づき、我々は与えられた文書に対してどのようなクエリが発行されるかを予測し、その予測結果で文書を拡張する単純な方法を提案する。このモデルは、クエリと関連文書のペアから構成されるデータセットを使用して訓練された通常のシーケンス・ツー・シーケンスモデルである。当社の手法と高性能な再ランキングコンポーネントを組み合わせることで、2つの検索タスクにおいて最先端の成果を達成した。低遅延が必要な状況下では、再ランキングなしでの検索結果のみでも、より計算コストが高い神経再ランキング器に匹敵する効果性が得られるが、処理速度は遥かに速い。