要約
ニューラルネットワークは、物体画像の分類に非常に有効な手法である。本研究で提案する物体画像の画像カテゴリ分類法は、畳み込みニューラルネットワーク(CNN)とサポートベクターマシン(SVM)を組み合わせたものである。特徴パターン抽出器として、大規模な物体画像データセットImageNetで事前学習されたCNN「AlexNet」を用いる。ImageNetで事前学習されたAlexNetを再学習せずにそのまま利用する。分類器としてトレーナブルなSVMを採用し、AlexNetから抽出された特徴ベクトルをSVMに入力する。対象となる物体画像としてSTL-10データセットを用い、クラス数は10である。学習用サンプルとテスト用サンプルは明確に分離されている。STL-10の物体画像は、データ拡張を用いてSVMで学習される。本手法では、コサイン関数を用いたパターン変換法を導入している。さらに、回転、歪み、エラスティック歪みなどの拡張手法も併用している。コサイン関数を用いることで、元のパターンが左揃え、右揃え、上揃え、下揃え、または中央揃えに変換され、さらに拡大処理も施されている。コサイン変換を用いた拡張により、テスト誤り率は16.055%から0.435百分率ポイント低下し、15.620%まで改善された。一方、回転、歪み、エラスティック歪みなどの他の拡張手法は、拡張なしの場合と比較して誤り率を増加させた。拡張後のデータ数は、元のSTL-10の5,000枚の学習サンプルに対して30倍に増加している。実験結果として、テスト用8,000枚のSTL-10物体画像に対する誤り率は15.620%となり、画像拡張が画像カテゴリ分類において有効であることが示された。