11日前

神経ネットワークを用いた依存構文解析のための効率的な2次元TreeCRF

Yu Zhang, Zhenghua Li, Min Zhang
神経ネットワークを用いた依存構文解析のための効率的な2次元TreeCRF
要約

深層学習(DL)時代において、多層BiLSTMが持つ優れた文脈表現能力の恩恵により、構文解析モデルは極めて簡略化されても性能への影響がほとんどない。特に、高い効率性と精度を備え、最も広く用いられているグラフベースの依存解析器であるバイアフィン解析器は、弧因子化仮定の下で単一の依存関係を直接スコアし、非常にシンプルな局所的なトークン単位の交差エントロピー損失関数を採用している。本論文では、初めてバイアフィン解析器に2次元TreeCRFの拡張を提案する。長年にわたり、インサイドアウトサイドアルゴリズムの計算複雑性と非効率性がTreeCRFの普及を阻んできたが、本研究では、GPU上で大規模な行列演算を直接行えるように、インサイドおよびビタビアルゴリズムを効果的にバッチ化し、複雑なアウトサイドアルゴリズムを回避するための効率的な逆伝播手法を提案する。13言語からなる27のデータセットに対する実験および分析の結果、深層学習時代以前に開発された技術、特に構造学習(グローバルなTreeCRF損失)や高次元モデリングが依然として有効であり、特に部分的にアノテーションされた学習データを用いる場合、最先端のバイアフィン解析器を上回る解析性能をさらに向上させることができることが明らかになった。本研究のコードは、https://github.com/yzhangcs/crfpar にて公開している。

神経ネットワークを用いた依存構文解析のための効率的な2次元TreeCRF | 最新論文 | HyperAI超神経