17日前
OpenIE6:オープン情報抽出のための反復的グリッドラベリングと連結構造解析
Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti

要約
最近の最先端的な神経系オープン情報抽出(OpenIE)システムは、抽出を反復的に生成するため、部分的な出力を繰り返しエンコーディングする必要があり、これにより大きな計算コストが発生する。一方、OpenIEに向けたシーケンスラベリングアプローチははるかに高速であるものの、抽出品質は劣る。本論文では、反復的ラベリングに基づく新しいアーキテクチャを提示することで、このトレードオフを克服し、OpenIEの新しい最先端性能を達成するとともに、10倍の高速化を実現した。この成果は、OpenIEを2次元グリッドラベリング問題として捉える画期的な「反復グリッドラベリング(Iterative Grid Labeling, IGL)」アーキテクチャによって達成された。さらに、訓練時にグリッドにカバレッジ(ソフト)制約を適用することで、性能をさらに向上させた。 また、最良のOpenIEシステムが並列構造(coordination structures)の処理に苦戦していることに着目し、同じIGLアーキテクチャを用いて構築された新たな並列構造解析器を本システムに組み込んだ。このIGLベースの並列構造解析器により、複雑な並列構造を効果的に処理できるだけでなく、並列構造解析というタスクにおいても、従来の解析器に対してF1スコアで12.3ポイントの向上を達成し、新たな最先端性能を確立した。本研究で提案するOpenIEシステム「OpenIE6」は、従来のシステムに対して最大でF1スコア4ポイントの向上を達成しつつ、大幅な高速化を実現した。