
要約
会話には内在的な一対多の特性があり、これは同じ対話コンテキストに対して複数の応答が適切であることを意味します。タスク指向型の対話では、この特性により、タスク完了に向けて異なる有効な対話ポリシーが存在します。しかし、既存のタスク指向型対話生成アプローチのいずれも、この特性を考慮していません。本研究では、一対多の特性を利用し、多様で適切な対話応答を生成するためのマルチアクションデータ拡張(MADA)フレームワークを提案します。具体的には、まず対話状態を使用して対話履歴を要約し、次に各対話状態から異なる有効なシステムアクションへのすべての可能なマッピングを見出します。対話システムの学習中に、現在の対話状態が前段階で見出されたすべての有効なシステムアクションにマッピングされるようにすることで、追加の状態-アクションペアを作成します。これらの追加ペアを取り入れることで、対話ポリシーはバランスの取れたアクション分布を学習し、さらにその分布に基づいて対話モデルが多様な応答を生成するよう導きます。実験結果は、提案したフレームワークが一貫して対話ポリシーの多様性を向上させることを示しており、応答の多様性と適切性も改善されています。当該モデルはMultiWOZにおいて最先端の成果を得ています。