
要約
人間の言語理解を、出力が部分順序集合(poset)である構造化予測タスクとして形式化する。現在のエンコーダデコーダアーキテクチャは、意味のposet構造を適切に考慮していないため、構成的汎化能力に乏しいという問題を抱えている。本論文では、言語における構成的汎化を実現するための新しい階層的posetデコーディングパラダイムを提案する。直感的には、(1) 提案手法は意味空間における部分的な順序不変性(partial permutation invariance)を強制することで、偏りのある順序情報への過学習を回避する。(2) 階層的なメカニズムにより、posetの高レベルな構造を捉えることが可能となる。本研究では、構成的汎化を測定することを目的として特別に設計された、大規模かつ現実的な自然言語質問応答データセット「Compositional Freebase Questions(CFQ)」を用いて、提案するデコーダーの性能を評価した。その結果、従来のデコーダーを上回る性能が確認された。