2ヶ月前
スロットは一回の発話で構築されない:部分スロットを含む対話
Sai Zhang; Yuwei Hu; Yuchuan Wu; Jiaman Wu; Yongbin Li; Jian Sun; Caixia Yuan; Xiaojie Wang

要約
スロット値は、特に電話番号や名前などの重要な情報の場合、対話の複数のターンにわたってセグメントごとに提供されることがあります。これは日常生活でよく見られる現象ですが、これまでの研究ではあまり注目されていませんでした。このギャップを埋めるため、本論文では新しいタスク「サブスロットに基づくタスク指向対話(Sub-Slot based Task-Oriented Dialog: SSTOD)」を定義し、SSTODに関する研究を促進するための中規模対話データセットSSDを構築しました。このデータセットには、中国語の名前、電話番号、ID番号、車両番号の4つの異なるドメインから4万件の対話と50万件の発話を含んでいます。データはサブスロット値、スロット値、対話状態およびアクションについて詳細にアノテーションが施されています。SSTODにおいて新たな言語現象やインタラクティブな手法が見つかりましたが、これらは対話エージェントの構築に重大な課題をもたらしています。我々は3つの最先端の対話モデルをSSTODでテストしましたが、4つのドメインいずれにおいても十分に対処できませんでした。また、プラグイン方式でスロット知識を取り入れた改良モデルについても調査を行いました。SSTODが実際のアプリケーションで広く存在することを考えると、さらなる研究が必要であることが明らかです。データセットとコードは公開されており、https://github.com/shunjiu/SSTOD からアクセスできます。