17日前
手書きテキスト認識におけるStackMixおよびBlotデータ拡張手法
Alex Shonenkov, Denis Karachev, Maxim Novopoltsev, Mark Potanin, Denis Dimitrov

要約
本稿では、現在の最先端手法を上回る性能を発揮する手書きテキスト認識(HTR)システムを提案する。比較実験は、HTRタスクで最も頻繁に使用される3つのデータセット、すなわちBen-tham、IAM、Saint Gallを対象に実施された。さらに、最近提示された2つのデータセット、Peter the Great's ManuscriptsおよびHKR Datasetについても、実験結果を提示している。本稿では、ニューラルネットワークのアーキテクチャについて記述するとともに、学習データ量を拡張する2つの手法を提案する。1つは、透過テキスト(Handwritten Blots)を模倣するオーグメンテーション手法であり、もう1つは新規に開発されたテキスト生成手法であるStackMixである。このStackMixは、HTRタスクにおいて非常に有効であることが実証された。また、印刷体テキストを入力として手書きテキストを生成する独立したタスクにも、StackMixは適用可能である。