要約
手書き数字および文字認識は、パターン認識分野において最も古くから存在する重要なトピックの一つである。手書きの数字および文字認識は、筆跡のスタイルの違い、構造の類似性、方向の角度の変化といった要因により、さまざまな課題を伴う。したがって、数字および文字の認識と分類に効果的な手法を確立することは極めて重要である。手書き数字および文字認識は、ナンバープレート認識、名刺情報抽出、銀行手形処理、郵便住所処理、パスポート処理、署名処理など、多岐にわたる応用が存在する。本研究では、ハイブリッド型離散ウェーブレット変換(DWT)と離散コサイン変換(DCT)を用いた特徴抽出に基づく手書き数字および文字認識手法を提案する。抽出された特徴量は、K近傍法(KNN)およびサポートベクターマシン(SVM)分類器に供給され、分類処理が行われる。実験には標準的なMNISTデータセットおよびEMNIST文字データセットが用いられた。まず、MNISTの数字データおよびEMNISTの文字データを二値化し、その後、雑音ピクセル(ストレイピクセル)を除去した。その後、ハイブリッドDWTとDCTを用いて特徴量を抽出し、KNNおよびSVM分類器を用いて分類を行った。提案手法は、SVM分類器を用いることで、数字認識において最大97.74%、文字認識において最大89.51%の認識精度を達成した。