2ヶ月前
ImageNetの事前学習を用いた歴史文書画像解析の包括的研究
Linda Studer; Michele Alberti; Vinaychandran Pondenkandath; Pinar Goktepe; Thomas Kolonko; Andreas Fischer; Marcus Liwicki; Rolf Ingold

要約
スキャンされた歴史的文書の自動分析は、画像解析タスクの広範な範囲を含んでおり、人間によるアノテーションが不足しているため、機械学習にとってしばしば挑戦的な課題となっています。深層ニューラルネットワークの登場により、訓練データの不足に対処する有望な方法として、異なるドメインの画像で事前学習を行ったモデルを歴史的文書に微調整することがあります。現在の研究では、クロスドメイン転移学習の一例として、ImageNetデータベースで事前学習された物体認識用ニューラルネットワークの使用があります。しかし、ImageNetと比較して根本的に異なる画像特性を持つ歴史的文書において、この事前学習がどの程度役立つかはまだ大部分が未解決の問題です。本論文では、文字認識、スタイル分類、手稿年代測定、意味的セグメンテーション、コンテンツベース検索など多様な歴史的文書分析タスクにおけるImageNet事前学習の効果について包括的な実証調査を行いました。ピクセルレベルでの意味的セグメンテーションについては複雑な結果を得ていますが、異なるネットワーク構造においても明確な傾向が見られ、ImageNet事前学習は分類およびコンテンツベース検索に肯定的な影響を与えていることが確認されました。