2ヶ月前

TextCaps: 小規模データセットを用いた手書き文字認識

Vinoj Jayasundara; Sandaru Jayasekara; Hirunima Jayasekara; Jathushan Rajasegaran; Suranga Seneviratne; Ranga Rodrigo
TextCaps: 小規模データセットを用いた手書き文字認識
要約

多くの地域言語は、ラベリングされた訓練データの量が不足しているため、最近の文字認識システムの進歩から恩恵を受けることができていません。これは、これらの言語のために大量のラベリングデータを生成することが困難であり、また深層学習技術が少ない訓練サンプルから適切に学習できないことが原因です。当研究では、既存のサンプルから新しい訓練サンプルを生成する手法を導入することでこの問題を解決します。この手法は、人間の手書き文字に実際に存在する変動を反映するために、現実的な拡張(augmentations)を行い、対応するインスタンスパラメータにランダムな制御ノイズを加えるものです。クラスあたり200個の訓練サンプルのみを使用した結果は、EMNIST-letterデータセットにおける既存の文字認識結果を超え、EMNIST-balanced、EMNIST-digits、MNISTの3つのデータセットにおいても既存の結果と同等の性能を達成しました。さらに、損失関数(loss functions)の組み合わせを効果的に使用する戦略を開発し、再構築精度を向上させました。当システムは、ラベリングされた訓練データが不足している地域言語での文字認識だけでなく、物体認識などの他の関連分野でも有用です。

TextCaps: 小規模データセットを用いた手書き文字認識 | 最新論文 | HyperAI超神経