17日前

文レベルの関係抽出のための改善されたベースライン

Wenxuan Zhou, Muhao Chen
文レベルの関係抽出のための改善されたベースライン
要約

文レベルの関係抽出(Relation Extraction, RE)は、文内における2つのエンティティ間の関係を同定することを目的としている。多くの研究努力がこの問題に向けられてきたが、現在の最良の手法であっても、まだ完全とは言えない状況にある。本論文では、既存のREモデルの性能に影響を与える2つの問題、すなわちエンティティ表現とノイズ混在または明確でないラベルの問題に再び注目する。タイプ付きマーカーを用いたエンティティ表現を組み込んだ改良型REベースラインは、TACREDデータセット上でF1スコア74.6%を達成し、従来のSOTA手法を著しく上回った。さらに、改良された新規ベースラインは、精緻化されたRe-TACREDデータセットにおいてF1スコア91.1%を達成し、事前学習言語モデル(Pretrained Language Models, PLMs)がこのタスクにおいて高い性能を発揮できることを示した。本研究で開発したコードをコミュニティに公開し、今後の研究に貢献することを目的としている。