17日前
HySPA:スケーラブルなテキストからグラフへの抽出のためのハイブリッドスパン生成
Liliang Ren, Chenkai Sun, Heng Ji, Julia Hockenmaier

要約
テキストからグラフへの抽出(Text-to-Graph extraction)は、自然言語テキストからメンションおよび型から構成される情報グラフを自動的に抽出することを目的としている。従来のアプローチとして、テーブル埋め込みやペアワイズスコアリングがあるが、これらはさまざまな情報抽出タスクにおいて優れた性能を示しているものの、入力テキストの長さに関して二次の空間・時間計算量を要するため、長文を含むデータセットへのスケーラビリティに課題を抱えている。本研究では、情報グラフをノードと辺の型が交互に並ぶシーケンスに一意に変換するハイブリッドスパン生成器(HySPA)を提案する。このアプローチは、線形時間および線形空間計算量で、スパンと型を再帰的に直接生成可能なハイブリッドスパンデコーダーを用いることで、効率的な抽出を実現する。ACE05データセットを用いた広範な実験の結果、本手法は共同エンティティおよび関係抽出タスクにおいて、最先端の手法を顕著に上回ることが確認された。