
要約
複数の意図を検出するおよびスロットを埋め込むという研究は、複雑な現実世界の状況との関連性から、ますます注目を集めている。近年の先進的なアプローチとして、グラフに基づく統合モデルが提案されているが、依然として二つの潜在的な課題に直面している。第一に、初期の意図やスロットに基づいてグラフを構築する過程で生じる不確実性により、意図とスロットの相関情報を誤ったラベルノードに伝達してしまう可能性があること。第二に、トークンレベルでの意図投票を直接複数の意図ラベルを各トークンに組み込む形で実装すると、スロット予測が誤る可能性が高まり、全体的な性能に悪影響を及ぼすおそれがあることである。これらの課題に対処するため、本研究ではMISCAと名付けた統合モデルを提案する。MISCAは、意図-スロット共注意力機構と、ラベル注意力機構を備えた下位レイヤーを導入することで、グラフ構築の必要性を排除しつつ、意図とスロットラベル間の相関を効果的に捉えることができる。これらの機構により、意図からスロット、およびスロットから意図へと、複数のラベル固有表現を介して双方向に相関情報を効率的に伝達することができる。この際、トークンレベルの意図情報に依存することなく、ラベルレベルの相関を活用できる。実験の結果、MISCAは従来のモデルを上回り、MixATISおよびMixSNIPSという二つのベンチマークデータセットにおいて、新たな最先端の全体精度を達成した。これは、本研究で提案する注意力機構の有効性を示している。