HyperAIHyperAI

Command Palette

Search for a command to run...

スキャンされた電子修士論文および博士論文から視覚的特徴を組み込んだ自動メタデータ抽出

Muntabir Hasan Choudhury Himarsha R. Jayanetti Jian Wu William A. Ingram Edward A. Fox

概要

電子修論・修博士論文(ETDs)には、引用ネットワークの分析や研究動向の予測など、多くのデジタル図書館のタスクに活用可能な分野固有の知識が含まれている。スケーラブルなデジタル図書館検索エンジンの構築において、メタデータの自動抽出は極めて重要である。しかし、既存の多くはデジタル原生文書を想定した手法であり、ETDに代表されるスキャンされた文書からのメタデータ抽出にはしばしば失敗する。従来のシーケンスタギング手法は主にテキストベースの特徴に依存している。本論文では、テキスト特徴と視覚特徴を統合した条件付き確率場(CRF)モデルを提案する。モデルの堅牢性を検証するため、既存コーパスを拡張し、人間による検証済みメタデータを備えた新規のグランドトゥルースコーパス(500枚のETD表紙)を構築した。実験の結果、視覚特徴を含むCRFモデルは、テキスト特徴のみを用いたヒューリスティック手法およびCRFモデルを上回る性能を示した。提案モデルは7つのメタデータ項目において、F1スコア81.3%~96%を達成した。本研究で用いたデータおよびソースコードは、それぞれGoogle Drive(https://tinyurl.com/y8kxzwrp)およびGitHubリポジトリ(https://github.com/lamps-lab/ETDMiner/tree/master/etd_crf)で公開されている


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
スキャンされた電子修士論文および博士論文から視覚的特徴を組み込んだ自動メタデータ抽出 | 記事 | HyperAI超神経