1ヶ月前

スケーラブルなニューラル対話状態追跡モデルの開発

Elnaz Nouri; Ehsan Hosseini-Asl
スケーラブルなニューラル対話状態追跡モデルの開発
要約

現在のニューラルベースの対話状態追跡モデルにおける遅延は、その高い精度性能にもかかわらず、生産システムへの効率的な展開を妨げています。本論文では、Zhongらが最近提案したGlobal-Local Self-Attention(GLAD)モデルに基づく新しいスケーラブルで正確なニューラル対話状態追跡モデルを提案します。このモデルは、異なるタイプ(スロットと呼ばれる)の対話状態間でパラメータを共有するためのグローバルモジュールを使用し、スロット固有の特徴を学習するためのローカルモジュールを使用します。提案されたモデルでは、GLADモデルで使用される(1 + スロット数)個のリカレントネットワークに代わり、グローバルコンディショニングのみを使用する1つのリカレントネットワークを使用することで、平均して訓練および推論時間における遅延を35%削減しながら、信念状態追跡の性能を97.38%(ターン要求)、88.51%(共同目標および精度)維持しています。複数ドメインデータセット(Multi-WoZ)での評価でも、提案されたモデルがGLADよりもターン情報提供と共同目標精度において優れていることが示されています。

スケーラブルなニューラル対話状態追跡モデルの開発 | 最新論文 | HyperAI超神経