HyperAIHyperAI

Command Palette

Search for a command to run...

TextCaps: 小規模データセットを用いた手書き文字認識

Vinoj Jayasundara Sandaru Jayasekara Hirunima Jayasekara Jathushan Rajasegaran Suranga Seneviratne Ranga Rodrigo

概要

多くの地域言語は、ラベリングされた訓練データの量が不足しているため、最近の文字認識システムの進歩から恩恵を受けることができていません。これは、これらの言語のために大量のラベリングデータを生成することが困難であり、また深層学習技術が少ない訓練サンプルから適切に学習できないことが原因です。当研究では、既存のサンプルから新しい訓練サンプルを生成する手法を導入することでこの問題を解決します。この手法は、人間の手書き文字に実際に存在する変動を反映するために、現実的な拡張(augmentations)を行い、対応するインスタンスパラメータにランダムな制御ノイズを加えるものです。クラスあたり200個の訓練サンプルのみを使用した結果は、EMNIST-letterデータセットにおける既存の文字認識結果を超え、EMNIST-balanced、EMNIST-digits、MNISTの3つのデータセットにおいても既存の結果と同等の性能を達成しました。さらに、損失関数(loss functions)の組み合わせを効果的に使用する戦略を開発し、再構築精度を向上させました。当システムは、ラベリングされた訓練データが不足している地域言語での文字認識だけでなく、物体認識などの他の関連分野でも有用です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
TextCaps: 小規模データセットを用いた手書き文字認識 | 記事 | HyperAI超神経