18日前

HEProto:少量サンプル命名エンティティ認識のためのマルチタスク学習に基づく階層的強化プロトタイプネットワーク

{Enhong Chen, Yi Zheng, Tong Xu, Pengfei Luo, Lili Zhao, Wei Chen}
要約

少数ショット命名エンティティ認識(Few-shot Named Entity Recognition, NER)は、限られた訓練サンプルで異なるドメインからのエンティティを同定・分類することを目的とするタスクであり、知識グラフ(Knowledge Graph, KG)構築の基本的なステップとして長年扱われてきました。近年、このタスクに対して多くの努力がなされ、優れた性能が達成されてきましたが、多くの手法は、スパン検出とタイプ分類という2つのサブタスクを互いに独立して扱う傾向にあり、これらのサブタスク間の整合性および相関性が十分に考慮されていません。さらに、従来の手法はエンティティの粗粒度的な特徴を適切に捉えられず、タイプの意味表現が不十分になる傾向があります。こうした問題を解決するため、本稿ではマルチタスク学習に基づく階層的強化プロトタイプネットワーク(Hierarchical Enhancing ProtoNet, HEProto)を提案します。本手法は、スパン検出とタイプ分類の2つのサブタスクを共同で学習し、それらの相関関係をモデル化することを目的としています。具体的には、対照学習(contrastive learning)を用いて、スパン境界情報およびタイプの意味表現を強化します。その後、タイプ分類フェーズにおいてエンティティの粗粒度情報を活用する階層的プロトタイプネットワークを設計し、モデルが細粒度の意味表現をより効果的に学習できるようにします。さらに、細粒度エンティティと関係のない粗粒度プロトタイプ間の類似性を低減するため、類似性マージン損失(similarity margin loss)を導入しました。広範な実験により、Few-NERDデータセット上で本手法が競合するベースライン手法を上回る性能を示したことが確認されました。HEProtoのソースコードは、https://github.com/fanshu6hao/HEProto にて公開されています。

HEProto:少量サンプル命名エンティティ認識のためのマルチタスク学習に基づく階層的強化プロトタイプネットワーク | 最新論文 | HyperAI超神経