
要約
DSTC7(Dialog System Technology Challenges 7)のnoetic end-to-end応答選択チャレンジは、実世界の目標指向対話システムにおける発話分類の最先端技術を推進することを目指しており、参加者は複数ターンのコンテキストに対して候補から正しい次の発話を選択する必要があります。本論文では、このチャレンジにおいて両データセットでトップランクを獲得した我々のシステムについて説明します。一つは焦点を絞った小さなデータセット(Advising)、もう一つはより多様で大きなデータセット(Ubuntu)です。従来の最先端モデルでは、コンテキストモデリングのために異なるターン間の発話相互作用を明示的にモデル化するために階層型(発話レベルとトークンレベル)ニューラルネットワークが使用されていました。本論文では、複数ターン応答選択に向けたチェインシーケンスのみに基づく逐次マッチングモデルを調査します。我々の結果は、過去に複数ターン応答選択における逐次マッチングアプローチの可能性が十分に活用されていなかったことを示しています。このチャレンジでのトップランク獲得だけでなく、提案されたモデルは従来のすべてのモデル、特に最先端の階層型モデルを上回り、2つの大規模公開複数ターン応答選択ベンチマークデータセットで新たな最先端性能を達成しました。