11日前

さまざまなNERサブタスクに対する統一的な生成フレームワーク

Hang Yan, Tao Gui, Junqi Dai, Qipeng Guo, Zheng Zhang, Xipeng Qiu
さまざまなNERサブタスクに対する統一的な生成フレームワーク
要約

命名エンティティ認識(Named Entity Recognition, NER)とは、文におけるエンティティを表すトークン列(スパン)を特定するタスクである。エンティティスパンが平坦(flat)、ネスト(nested)、または非連続(discontinuous)であるかにかかわらず、NERタスクはそれぞれ平坦NER、ネストNER、非連続NERというサブタスクに分類される。これらのサブタスクは従来、トークンレベルのシーケンスラベリングまたはスパンレベルの分類によって主に解決されてきた。しかし、これらのアプローチでは、3種類のNERサブタスクを同時に処理することは困難である。この課題に対処するため、本研究ではNERサブタスクをエンティティスパンのシーケンス生成タスクとして定式化する手法を提案する。このアプローチにより、統一的なシーケンス・トゥ・シーケンス(Seq2Seq)フレームワークを用いて、タグスキーマの特別な設計やスパンの列挙方法を用いずに、3種類すべてのNERサブタスクを一括して解決できる。また、エンティティを線形化するための3種類のエンティティ表現を活用することで、効果的なモデル構築を実現した。提案するフレームワークは実装が容易であり、平坦NER・ネストNER・非連続NERを含む8つの英語NERデータセットにおいて、最先端(SoTA)またはほぼ最先端の性能を達成している。

さまざまなNERサブタスクに対する統一的な生成フレームワーク | 最新論文 | HyperAI超神経