2ヶ月前
科学知識グラフ構築のための多タスク実体識別、関係識別、および共参照識別
Yi Luan; Luheng He; Mari Ostendorf; Hannaneh Hajishirzi

要約
科学論文におけるエンティティの識別と分類、関係の特定、および共参照クラスタリングのマルチタスク設定を紹介します。私たちはSciERCというデータセットを作成しました。このデータセットには3つのタスクすべてのアノテーションが含まれており、共有スパン表現を使用した統一的なフレームワークであるScientific Information Extractor (SciIE)を開発しました。マルチタスク設定は、タスク間の連鎖エラーを軽減し、共参照リンクを通じて文間関係を活用します。実験結果は、ドメイン固有の特徴を使用せずに、私たちのマルチタスクモデルが科学情報抽出において以前のモデルを上回ることを示しています。さらに、このフレームワークが科学知識グラフの構築を支援し、それを用いて科学文献内の情報を分析できることも示しました。