2ヶ月前
HENet: フォント認識のためのネットワークをより深く考えさせる
Chen, Jingchao ; Mu, Shiyi ; Xu, Shugong ; Ding, Youdong

要約
近年、テキスト認識/OCRの分野で多くの進歩が見られましたが、フォント認識の課題は依然として難易度が高いままであります。この課題の主な難しさは、類似したフォント間の微妙な違いにあり、それらを区別することが困難である点にあります。本論文では、フォント認識タスクを解決するための新しいフォント認識器とプラグイン可能なモジュールを提案します。このプラグイン可能なモジュールは最も識別力のある特徴を隠し、ネットワークに他の複雑な特徴を考慮させるように設計されており、特に類似したフォントの難しい例(HE Block)を解くために使用されます。既存の公開されたフォント認識システムと比較して、我々が提案する方法は推論段階でのインタラクションを必要としません。広範囲にわたる実験結果から、HENetは文字レベルデータセットExplor_allおよび単語レベルデータセットAdobeVFRにおいても有望な性能を達成していることが示されています。