
要約
実体と関係の同時抽出は、両方のタスクでより高い性能を提供する可能性があるため、大きな注目を集めています。既存の手法の中でも、CopyREは効果的かつ革新的であり、シーケンス・ツー・シーケンスフレームワークとコピー機構を使用して直接関係三項組を生成します。しかし、このモデルには二つの致命的な問題があります。一つは、ヘッド実体とテール実体を区別するのが極めて弱いことで、これにより実体の抽出が正確でないという問題です。もう一つは、複数トークンからなる実体(例:\textit{Steven Jobs})を予測できないという問題です。これらの問題に対処するために、まず不正確な実体抽出の原因について詳細に分析し、次にこの問題を解決するための単純ながら非常に効果的なモデル構造を提案します。さらに、複数トークンからなる実体を予測できるようにするために、コピー機構を備えたマルチタスク学習フレームワークであるCopyMTLを提案します。実験結果はCopyREの問題点を明らかにするとともに、私たちのモデルがNYTデータセットでは9%、WebNLGデータセットでは16%(F1スコア)という大幅な改善を達成していることを示しています。当該コードはhttps://github.com/WindChimeRan/CopyMTL で公開されています。注:「\textit{Steven Jobs}」は人名であり、「複数トークンからなる実体」の一例として挙げられています。「Steven Jobs」は「スティーブ・ジョブズ」と訳すこともできますが、ここでは原文の形式に準拠してそのまま表記しました。