
要約
構造予測における大きな課題の一つは、出力構造内の相関関係を適切に表現することである。出力が系列として構造化されている場合、線形鎖状の条件付き確率場(CRF)は、出力内の局所的依存関係を学習できる広く用いられるモデルクラスである。しかし、CRFのマルコフ仮定により、非局所的依存関係を持つ分布を表現することが不可能となり、標準的なCRFはデータの非局所的制約(例えば、出力ラベルに関するグローバルなアリティ制約)を満たすことができない。本研究では、可能な出力構造の空間を正則言語 $\mathcal{L}$ として指定することにより、非局所的制約を含む広範な制約を強制可能なCRFの一般化を提示する。得られた正則制約付きCRF(RegCCRF)は、標準CRFと同様の形式的性質を持つが、$\mathcal{L}$ に属さないラベル系列には確率ゼロを割り当てる。特に、RegCCRFはトレーニング段階で制約を組み込むことができるのに対し、関連するモデルはデコード段階でのみ制約を強制する。我々は、制約付きトレーニングが制約付きデコードよりも劣ることがないことを理論的に証明し、実験的にも実際の性能向上が顕著に得られることを示した。さらに、セマンティック役割ラベリングのための深層ニューラルモデルにRegCCRFを組み込むことで、標準データセット上で最先端の結果を上回る実用的な利点を示した。