
要約
エンティティの言及が再帰的に他の言及を含むことは一般的です。本論文では、言及の入れ子構造をモデル化するスケーラブルな遷移ベースの手法を紹介します。まず、入れ子構造を持つ文を各言及が森の構成要素に対応する指定された森にマッピングします。次に、シフトリダクションに基づくシステムが、スタックLSTM(Stack-LSTM)を使用してシステムの状態を効率的かつ効果的に連続空間で表現し、その最大長が文の長さの3倍であることが保証されたアクションシーケンスを通じて下位から上位へと森の構造を学習して構築します。さらに、文字レベルのパターンを捉えるためにキャラクターベースのコンポーネントがシステムに組み込まれています。提案したモデルはACEデータセットにおいて最先端の結果を達成しており、入れ子構造を持つ言及検出における有効性を示しています。