11日前
発話言語理解のためのラベル意味注入を備えた動的グラフインタラクティブフレームワーク
Zhihong Zhu, Weiyuan Xu, Xuxin Cheng, Tengtao Song, Yuexian Zou

要約
マルチインテント検出とスロットフィリングを統合したモデルは、より複雑な現実世界のシナリオに近いことから、近年注目を集めている。しかし、既存の手法には以下の課題がある。(1) 両タスクにおいて、発話とワンホット符号化されたラベル間の潜在的な相関関係に焦点を当てつつ、ラベルの明示的な特徴を無視している点;(2) 各トークンに対してマルチインテント情報を直接組み込むため、関係のないインテントが導入されることでスロット予測が誤られる可能性がある点。本論文では、ラベルの意味情報を活用してモデルに追加の信号と豊かな事前知識を提供するフレームワーク「DGIF」を提案する。その後、インテントとスロット間の相関をモデル化するためのマルチグレイン相互作用グラフを構築する。具体的には、ラベルの意味情報を注入する新たなアプローチを提案し、グラフを自動で更新することで誤伝播の緩和をより効果的に行う。実験結果から、本フレームワークは既存手法を著しく上回り、MixATISデータセットにおける全体精度で、従来の最良モデルに対して相対的に13.7%の改善を達成した。