
要約
エンティティ解析スタックにおける3つの中心的なタスク——コアファレンス解決(ドキュメント内クラスタリング)、固有表現認識(粗い意味的タイプ分類)、エンティティリンク(Wikipediaエンティティとのマッチング)——を統合的に扱うモデルを提案する。本モデルは形式的には構造化条件付き確率場(structured conditional random field)である。一項因子は各タスクに対する強力なベースラインから得られる局所的特徴を表現する。さらに、二項および三項因子を導入し、タスク間の相互作用を捉える。例えば、同義的な参照表現は同一の意味的タイプを持つという制約をモデル化する。ACE 2005およびOntoNotesデータセットにおいて、本モデルは3つのタスクすべてで最先端の性能を達成した。また、独立した強力なベースラインと比較して、統合的なモデリングにより各タスクの性能が向上した。