16日前
会話変更を意識したCRFを用いた会話行動分類
Guokan Shang, Antoine Jean-Pierre Tixier, Michalis Vazirgiannis, Jean-Pierre Lorré

要約
対話行動(Dialogue Act, DA)分類に関する最近の研究では、このタスクがシーケンスラベリング問題として扱われており、ニューラルネットワークモデルと条件付き確率場(Conditional Random Field, CRF)を最後の層に組み合わせたアプローチが用いられている。CRFは、入力発話シーケンスが与えられたもとでの目標DAラベルシーケンスの条件付き確率をモデル化する。しかし、このタスクにはもう一つ重要な入力シーケンス、すなわち発話者のシーケンスが存在するが、従来の研究ではこれを無視している。この制約を克服するために、本論文では発話者変更を考慮するようにCRF層を単純に修正する手法を提案する。SwDAコーパスを用いた実験の結果、提案手法は従来のCRF層を大幅に上回り、特に一部のDAラベルにおいて顕著な性能向上が確認された。さらに、可視化により、本CRF層がエンド・ツー・エンドの枠組み内で、発話者変更を条件としたDAラベル対間の意味的で洗練された遷移パターンを学習可能であることが示された。実装コードは公開されている。