HyperAIHyperAI

Command Palette

Search for a command to run...

並列システムを活用した文書画像分類の精度向上と高速化

Javier Ferrando Juan Luis Dominguez Jordi Torres Raul Garcia David Garcia Daniel Garrido Jordi Cortada Mateo Valero

概要

本稿では、機関のデジタル化プロセスにおいて重要な課題である文書分類タスクにおいて、より重い畳み込みニューラルネットワーク(CNN)と比較してEfficientNetモデルがもたらす利点について検証する研究を提示する。RVL-CDIPデータセット上での実験により、より軽量なモデルを用いることで従来の成果を上回ることを示し、Tobacco3482のような小規模なドメイン固有データセットにおいても転移学習の有効性を確認した。さらに、OCRによって抽出したテキストをBERTモデルで処理した結果と、画像モデルの予測を統合するアンサンブルパイプラインを提案し、画像入力のみに依存するアプローチを大幅に向上させることを示した。また、バッチサイズを拡大しても精度を損なわず、複数のGPUを活用した並列化により学習プロセスを高速化でき、計算時間の短縮が可能であることを明らかにした。最後に、PyTorchとTensorFlowという2つのディープラーニングフレームワークにおける学習性能の差異についても検証した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています