11日前
CM-Net:音声言語理解のための新しい協調メモリネットワーク
Yijin Liu, Fandong Meng, Jinchao Zhang, Jie Zhou, Yufeng Chen, Jinan Xu

要約
音声言語理解(Spoken Language Understanding, SLU)は、主に意図検出(intent detection)とスロット埋め込み(slot filling)の2つのタスクから構成され、従来の研究ではこれらを統合的にモデル化するアプローチが一般的である。しかし、多くの既存モデルはスロットと意図の間の共起関係(co-occurrence relations)を十分に活用できていないため、その性能の潜在能力が制限されている。この問題に対処するため、本論文では、新たに設計されたモジュール「CMブロック(CM-block)」を基盤とする新しい協調記憶ネットワーク(Collaborative Memory Network, CM-Net)を提案する。CMブロックは、まず記憶領域からスロット固有および意図固有の特徴を協調的に抽出し、次にその豊富化された特徴を用いて局所的な文脈表現を強化する。これにより、順次的な情報伝達が行われ、より具体的な(スロットおよび意図に関する)全体的な発話表現が得られる。複数のCMブロックを積層することで、CM-Netは、固有の記憶、局所的な文脈、および全体的な発話表現の間で交互に情報交換を実現でき、各要素が段階的に相互に豊かになる。本研究では、2つの標準ベンチマーク(ATISおよびSNIPS)および自ら収集したコーパス(CAIS)上でCM-Netの性能を評価した。実験結果から、ATISおよびSNIPSでは多数の評価基準で最先端の性能を達成し、CAISではベースラインモデルと比較して顕著な性能向上が確認された。さらに、本研究ではCAISデータセットを研究コミュニティに公開する。