11日前
音声言語理解のためのトークンレベル意図検出を備えたスタック伝播フレームワーク
Libo Qin, Wanxiang Che, Yangming Li, Haoyang Wen, Ting Liu

要約
発話言語理解(SLU)システムの構築において、意図検出(intent detection)とスロット埋め込み(slot filling)は主な2つのタスクである。これらのタスクは密接に関連しており、スロットの抽出はしばしば意図に強く依存する。本論文では、意図情報をより効果的に組み込むことで、スロット埋め込みをさらに効果的に導く新たなSLUフレームワークを提案する。本フレームワークでは、スタック伝播(Stack-Propagation)を用いた統合モデルを採用し、意図情報を直接スロット埋め込みの入力として利用可能にする。これにより、意図の意味的知識をより正確に捉えることが可能となる。さらに、誤差伝搬を緩和するため、スタック伝播フレームワークにおいてトークンレベルでの意図検出を実施する。公開データセット2つにおける実験結果から、本モデルが最先端の性能を達成し、従来の手法と比べて大幅な性能向上を示した。最終的に、本フレームワークにTransformerからの双方向エンコーダ表現(Bidirectional Encoder Representation from Transformer: BERT)モデルを導入することで、SLUタスクにおける性能がさらに向上した。