
要約
対話状態追跡は、音声対話システムの核心的な部分です。この技術は、各対話ターンにおいてユーザーの目標を推定します。しかし、現在の大多数のアプローチでは、大規模な対話ドメインへのスケーリングが困難です。これらのアプローチには以下の制限があります:(a) いくつかのモデルは、オントロジー内のスロット値が動的に変化する状況で機能しません;(b) モデルのパラメータ数はスロット数に比例します;(c) いくつかのモデルは手作業で作成された語彙に基づいて特徴を抽出します。これらの課題に対処するために、我々はStateNetという普遍的な対話状態追跡器を提案します。StateNetはスロット値の数に依存せず、すべてのスロット間でパラメータを共有し、明示的な意味辞書ではなく事前学習済みの単語ベクトルを使用します。我々が2つのデータセットに対して行った実験結果から、本手法は上記の制限を克服するとともに、最先端の手法よりも大幅に性能を向上させていることが示されました。