
要約
タスク指向型会話システムは、ユーザーの意図を表現するためにしばしば会話状態追跡(Dialogue State Tracking: DST)を用いる。これは、事前に定義されたスロットの値を埋める作業を含む。これまでに多数のアプローチが提案されており、多くの場合、タスク固有のアーキテクチャと専用の分類器を用いている。近年では、事前学習された言語モデルに基づくより汎用的なアーキテクチャを用いた手法により、優れた結果が得られている。本研究では、スキーマ駆動型プロンプティングを用いた言語モデリングアプローチの新しい変種を提案する。この手法は、カテゴリカルなスロットと非カテゴリカルなスロットの両方に対して、タスクに適応した履歴表現を提供する。さらに、ドメイン内知識として自然に存在するスキーマの説明をプロンプティングに組み込むことで、性能をさらに向上させた。本研究で提案する完全に生成型のシステムは、MultiWOZ 2.2において最先端の性能を達成し、他の2つのベンチマークであるMultiWOZ 2.1およびM2Mでも競争力のある結果を示した。データとコードは、https://github.com/chiahsuan156/DST-as-Prompting にて公開される予定である。