11日前

複数分野における研究論文の共参照解決

Arthur Brack, Daniel Uwe Müller, Anett Hoppe, Ralph Ewerth
複数分野における研究論文の共参照解決
要約

共参照解決は、テキスト要約や質問応答といった高レベルな情報検索タスクを支援するための自動テキスト理解において不可欠な技術である。これまでの研究では、BERTを基盤とする最先端のアプローチが、学術論文に適用された場合、性能が顕著に低下することが示されている。本稿では、研究論文における共参照解決およびその後の知識グラフ(KG)構築のタスクに着目し、以下の貢献を提示する:(1)科学・技術・医学(STM)の10分野にまたがる、共参照解決用のアノテーション付きコーパスを構築した;(2)研究論文における自動共参照解決を実現するための転移学習アプローチを提案した;(3)共参照解決が知識グラフ構築に与える影響を分析した;(4)10分野のSTM分野における55,485編の論文から自動的に構築された研究用知識グラフを公開した。包括的な実験により、提案手法の有効性を検証した。本研究の転移学習アプローチは、自ら構築したコーパスにおいて、最先端のベースラインを大きく上回り、F1スコア61.4(+11.0)を達成した。また、ゴールドスタンダード知識グラフを用いた評価では、共参照解決が知識グラフの構築品質を顕著に向上させ、F1スコア63.5(+21.8)を実現した。

複数分野における研究論文の共参照解決 | 最新論文 | HyperAI超神経