6ヶ月前

ドキュメント理解

自然言語処理

マルチモーダル

自然言語処理

マルチモーダル

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

概要

視覚的に豊かな文書（VRD: Visually Rich Documents）からの重要な情報抽出に関する従来の研究は、各バウンディングボックス内に含まれるテキスト（すなわち、意味的エンティティ）のラベリングに主眼を置いてきたが、エンティティ間の関係についてはほとんど検討されていない。本論文では、一般的に用いられる依存構文解析モデルであるバイアフィン・パーサー（biaffine parser）を、このエンティティ関係抽出タスクに適応させた。従来の依存構文解析モデルが単語間の依存関係を認識するのに対し、本研究ではレイアウト情報を活用して単語群間の関係を同定する。また、意味的エンティティの異なる表現方法、異なるVRDエンコーダー、および異なる関係デコーダーを比較検証した。その結果、提案モデルはFUNSDデータセットにおいて65.96%のF1スコアを達成した。実際の業務応用においても、当社内での税関データ処理に導入されており、本番環境でも信頼性の高い性能を発揮している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

ドキュメント理解

自然言語処理

マルチモーダル

自然言語処理

マルチモーダル

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

概要

視覚的に豊かな文書（VRD: Visually Rich Documents）からの重要な情報抽出に関する従来の研究は、各バウンディングボックス内に含まれるテキスト（すなわち、意味的エンティティ）のラベリングに主眼を置いてきたが、エンティティ間の関係についてはほとんど検討されていない。本論文では、一般的に用いられる依存構文解析モデルであるバイアフィン・パーサー（biaffine parser）を、このエンティティ関係抽出タスクに適応させた。従来の依存構文解析モデルが単語間の依存関係を認識するのに対し、本研究ではレイアウト情報を活用して単語群間の関係を同定する。また、意味的エンティティの異なる表現方法、異なるVRDエンコーダー、および異なる関係デコーダーを比較検証した。その結果、提案モデルはFUNSDデータセットにおいて65.96%のF1スコアを達成した。実際の業務応用においても、当社内での税関データ処理に導入されており、本番環境でも信頼性の高い性能を発揮している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

視覚的に豊かな文書におけるエンティティ関係抽出：依存構文解析としてのアプローチ | 記事 | HyperAI超神経