17日前
視覚的に豊かな文書におけるエンティティ関係抽出:依存構文解析としてのアプローチ
Yue Zhang, Bo Zhang, Rui Wang, Junjie Cao, Chen Li, Zuyi Bao

要約
視覚的に豊かな文書(VRD: Visually Rich Documents)からの重要な情報抽出に関する従来の研究は、各バウンディングボックス内に含まれるテキスト(すなわち、意味的エンティティ)のラベリングに主眼を置いてきたが、エンティティ間の関係についてはほとんど検討されていない。本論文では、一般的に用いられる依存構文解析モデルであるバイアフィン・パーサー(biaffine parser)を、このエンティティ関係抽出タスクに適応させた。従来の依存構文解析モデルが単語間の依存関係を認識するのに対し、本研究ではレイアウト情報を活用して単語群間の関係を同定する。また、意味的エンティティの異なる表現方法、異なるVRDエンコーダー、および異なる関係デコーダーを比較検証した。その結果、提案モデルはFUNSDデータセットにおいて65.96%のF1スコアを達成した。実際の業務応用においても、当社内での税関データ処理に導入されており、本番環境でも信頼性の高い性能を発揮している。