17日前

接続節からのオープン情報抽出

{{Mausam}, Swarnadeep Saha}
接続節からのオープン情報抽出
要約

我々は、依存構文解析から得られた連接構造(conjuncts)を改善するための協調解析システムCALMを開発した。CALMは、言語モデルに基づくスコアリングと複数の言語学的制約を用いて、ネストされた連接構造を扱うための階層的な連接境界を探索する。この連接境界を中心に複合文を分割することで、CALMは複数の単純文を出力する。本研究では、オープン情報抽出(Open IE)という最終タスクにおけるCALMの有効性を実証した。最先端のOpen IEシステムは、複合文の処理が不十分であるため、大幅な抽出量(yield)の損失を被っている。我々が提案するOpen IEシステムCALMIEは、CALMによって識別された単純文を対象に抽出処理を行うことで、元の複合文からの抽出と比較して、精度のわずかな上昇を伴いながらも、最大1.8倍の抽出量を達成した。