
要約
ニューラルエンコーダーの強力な表現力により、局所的な特徴を用いるニューラルチャートベースの構文解析器は、非常に競争力のある性能を達成している。近年、CRF構造における非局所的特徴が性能向上に寄与することが示された。本論文では、局所的なスパンベースの解析器の学習プロセスに非局所的特徴を組み込む手法を検討する。具体的には、構文成分のn-gramとしての非局所パターンを予測し、それらの非局所パターンと局所的な構文成分との一貫性を保証する。実験結果から、本手法はPTBおよびCTBの両データセットにおいて、自己注意機構を用いるパーサーよりも優れた結果を達成することが明らかになった。さらに、本手法はPTBにおいて95.92のF1スコアという、BERTをベースとする最新の性能を達成し、CTBでも92.31の高いF1スコアを記録した。また、多言語およびゼロショットクロスドメイン設定においても、ベースラインと比較してより優れた、あるいは競争力のある性能を示した。