
要約
多ターン対話における複数の候補から適切な応答を選択することは、検索ベースの対話システムにとって重要な課題です。既存の研究では、このタスクを発話と候補との間のマッチングとして定式化し、モデルの学習においてクロスエントロピー損失を使用しています。本論文では、監督付きコントラスト学習(supervised contrastive loss)を用いてこの問題に取り組みます。これにより、埋め込み空間において正例の表現と負例の表現がより遠くに分離され、マッチング性能が向上します。さらに、我々は二段階監督付きコントラスト学習(two-level supervised contrastive learning)という新しい手法を開発し、これを多ターン対話での応答選択に適用しました。当手法では、文トークンシャッフル(STS: Sentence Token Shuffling)と文再順序化(SR: Sentence Re-ordering)という2つの技術を用いて監督付きコントラスト学習を行います。3つのベンチマークデータセットを用いた実験結果は、提案手法がコントラスト学習の基準モデルおよび最先端手法を有意に上回ることを示しています。