
要約
マルチターン検索ベースの対話は、インテリジェントな対話システムを構築する上で重要なタスクである。従来の研究は、複数の粒度レベルで候補応答と各文脈発話とのマッチングに主眼を置いてきたが、これにより過剰な文脈情報を使用する際の副作用を無視している。文脈発話はより多くのマッチング特徴を抽出するための豊富な情報を提供する一方で、ノイズ信号や不要な情報も同時に導入する。本論文では、多すぎる文脈発話の使用がもたらす副作用を分析し、その問題を緩和するためのマルチホップセレクターネットワーク(MSN)を提案する。具体的には、MSNはまずマルチホップセレクターを用いて関連する発話を文脈として選択する。その後、フィルタリングされた文脈と候補応答をマッチングさせ、マッチングスコアを取得する。実験結果から、MSNは3つの公開マルチターン対話データセットにおいて、いくつかの最先端手法を上回る性能を発揮することが示された。