11日前

科学文書からの共同エンティティおよび関係抽出:言語情報およびエンティティタイプの役割

{Partha Pratim Das, Debarshi Kumar Sanyal, Sudakshina Dutta, Prantika Chakraborty, T Y S S Santosh}
科学文書からの共同エンティティおよび関係抽出:言語情報およびエンティティタイプの役割
要約

科学論文には、さまざまな分野固有のエンティティおよびそれらの間の関係が含まれている。これらのエンティティとその関係は、文書の主題に関する重要な情報を簡潔に捉えており、したがって文書の理解および自動解析において極めて重要である。本論文では、深層ニューラルモデルを用いて科学的要約(abstract)からエンティティおよび関係を自動抽出することを目的としている。入力文に対して、事前に学習されたTransformerモデルを用いてトークンの文脈的埋め込みを生成し、さらにそのトークンの品詞(POS)タグの埋め込みで拡張する。拡張されたトークン表現の系列はスパンを形成し、エンティティと関係はスパン上で同時に学習される。エンティティ分類器によって予測されたエンティティロジットは、関係分類器における特徴として利用される。提案するモデルは、SciERCおよびADEデータセットにおけるエンティティ抽出および関係抽出のタスクにおいて、既存の競合ベースラインを上回る性能を達成した。

科学文書からの共同エンティティおよび関係抽出:言語情報およびエンティティタイプの役割 | 最新論文 | HyperAI超神経