18日前

検索ベース対話における多様な種類のディープインタラクティブ表現を用いた応答ランキング

{Dongyan Zhao, Rui Yan, Wei Wu, Jiazhan Feng, Chongyang Tao, Ruijian Xu}
要約

複数の会話ターンにわたる文脈に基づいて適切な応答を選択できる知能型対話システムの構築は、以下の3つの観点から困難を伴う:(1)文脈と応答の対の意味は、語彙、句、部分文など複数の粒度の言語単位に依存していること;(2)対話データには局所的依存(たとえば単語周辺の小さな窓内での依存)と長距離依存(文脈と応答間を横断する単語間の依存)が共存すること;(3)文脈と応答候補の関係は、複数の関連する意味的ヒントや、実際のケースでは比較的曖昧な意味的ヒントに依存していること。しかし、従来の手法は対話文を単一タイプの表現で符号化し、文脈と応答候補間の相互作用プロセスを浅いレベルで実行するため、対話内容の理解が不十分となり、文脈と応答間の意味的関連性の認識を阻害する可能性がある。この課題に対処するため、本研究では「表現[K]-相互作用[L]-マッチング」フレームワークを提案する。このフレームワークは、複数の種類の深層的相互作用表現を活用し、文脈-応答マッチングモデルを構築することで、応答選択の精度を向上させる。特に、発話-応答ペアに対して異なる種類の表現を構築し、符号化と相互作用を交互に繰り返すことで、表現の深さを強化する。これにより、モデルは表現段階で隣接要素の関係や句構造パターン、長距離依存を効果的に処理でき、文脈-応答ペア間の複数層にわたる相互作用を通じてより正確な予測を実現する。3つの公開ベンチマークにおける実験結果から、提案モデルは従来の従来型文脈-応答マッチングモデルを著しく上回り、リトリーバル型対話システムにおける複数ターン応答選択において、BERTモデルと比較してわずかに優れた性能を達成した。