11日前

対話行動予測におけるシーケンス・トゥ・シーケンスモデルにおける注目メカニズムの誘導

Pierre Colombo, Emile Chapuis, Matteo Manica, Emmanuel Vignon, Giovanna Varni, Chloe Clavel
対話行動予測におけるシーケンス・トゥ・シーケンスモデルにおける注目メカニズムの誘導
要約

会話対話に基づく対話行動(Dialog Act, DA)の予測は、対話型エージェントの開発において重要な要素である。DAの正確な予測には、会話の構造およびタグ間のグローバルな依存関係を精密にモデル化する必要がある。本研究では、ニューラル機械翻訳(NMT)で広く採用されているseq2seqアプローチを活用し、タグの順次性をより効果的にモデル化することを目的とする。seq2seqモデルは複雑なグローバル依存関係を学習できることが知られている一方で、従来の線形条件付き確率場(Linear Conditional Random Field, CRF)に基づく手法は、主に局所的なタグ依存関係しかモデル化できない。本研究では、DA分類に特化したseq2seqモデルを提案する。具体的には、階層的エンコーダ、新規のガイド付きアテンション機構、および学習・推論の両フェーズにビームサーチを適用する。既存の最先端手法と比較して、本モデルは手動で設計された特徴量を必要とせず、エンド・ツー・エンドで訓練可能である。さらに、提案手法はSwDAデータセットにおいて85%という優れた正解率を達成し、MRDAデータセットでは91.6%という最先端の正解率を記録した。

対話行動予測におけるシーケンス・トゥ・シーケンスモデルにおける注目メカニズムの誘導 | 最新論文 | HyperAI超神経