2ヶ月前

EMNIST: MNISTの手書き文字への拡張

Gregory Cohen; Saeed Afshar; Jonathan Tapson; André van Schaik
EMNIST: MNISTの手書き文字への拡張
要約

MNISTデータセットは、学習、分類、およびコンピュータビジョンシステムの標準的なベンチマークとなっています。その普及に貢献している要因には、タスクの理解しやすさと直感性、比較的小さなサイズとストレージ要件、そしてデータベース自体の利用しやすさとアクセシビリティがあります。MNISTデータベースは、数字や大文字・小文字の手書き文字を含むより大きなデータセットであるNIST特殊データベース19から派生しています。本論文では、MNISTデータセットを作成するために使用された同じ変換手法を用いて生成した完全なNISTデータセットのバリエーションであるExtended MNIST(EMNIST)を紹介します。その結果、文字と数字を含むより困難な分類タスクが得られました。これらのデータセットは元のMNISTタスクと同じ画像構造とパラメータを持ち、既存のすべての分類器やシステムとの直接的な互換性を保っています。ベンチマーク結果とともに、変換されたNIST数字とMNIST数字の分類結果を比較することで変換プロセスの検証も行われています。