
要約
自然言語処理において、多くのエンティティが他のエンティティを内部に含むことは一般的である。既存の多数の命名エンティティ認識(NER)手法は、平坦なエンティティ(flat entities)にのみ対応しており、ネストされたエンティティ(nested entities)には対応していない。本研究では、エンティティの境界情報を活用してエンティティのカテゴリラベルを予測する境界認識型ニューラルモデルを提案する。本モデルは、シーケンスラベリングモデルを用いてエンティティの境界を検出することで、エンティティの位置を高精度に特定する。検出された境界に基づき、境界に関連する領域を用いてエンティティのカテゴリラベルを予測するため、計算コストの削減と階層的シーケンスラベリングモデルにおける誤差伝播問題の緩和が可能となる。さらに、エンティティ境界とそのカテゴリラベルの依存関係を捉えるためにマルチタスク学習を導入することで、エンティティの識別性能を向上させている。実験はGENIAデータセット上で実施した結果、本モデルは他の最先端手法を上回る性能を示した。