HyperAIHyperAI

Command Palette

Search for a command to run...

ドキュメント画像分類におけるドメイン内転移学習と深層畳み込みニューラルネットワークのスタック化汎化

Arindam Das; Saikat Roy; Ujjwal Bhattacharya; Swapan Kumar Parui

概要

本研究では、文書構造学習のための領域ベースの深層畳み込みニューラルネットワーク(DCNN)フレームワークを提案しています。本研究の貢献点は、領域ベースの分類器の効率的な学習と、文書画像分類における有効なアンサンブル手法にあります。一次的な「ドメイン間」転移学習では、ImageNetデータセットで事前学習されたVGG16アーキテクチャから重みをエクスポートし、全体の文書画像に対して文書分類器を学習させています。「ドメイン内」転移学習の二次的な利用により、画像セグメントに対する深層学習モデルの迅速な学習が可能となっています。最後に、スタック化一般化に基づくアンサンブル手法が用いられ、基本となる深層ニューラルネットワークモデルの予測結果を統合しています。提案手法は、一般的なRVL-CDIP文書画像データセットにおいて92.2%という最先端の精度を達成しており、既存アルゴリズムによって設定されたベンチマークを超える結果となっています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
ドキュメント画像分類におけるドメイン内転移学習と深層畳み込みニューラルネットワークのスタック化汎化 | 記事 | HyperAI超神経