2ヶ月前

PCANet: 画像分類のためのシンプルな深層学習ベースライン

Tsung-Han Chan; Kui Jia; Shenghua Gao; Jiwen Lu; Zinan Zeng; Yi Ma
PCANet: 画像分類のためのシンプルな深層学習ベースライン
要約

本研究では、画像分類用の非常に単純な深層学習ネットワークを提案します。このネットワークは、基本的なデータ処理コンポーネントのみで構成されています:連続した主成分分析(PCA)、バイナリハッシング、およびブロックヒストグラム。提案されたアーキテクチャでは、PCAが多段フィルタバンクの学習に使用されます。その後、インデックスとプーリングのために単純なバイナリハッシングとブロックヒストグラムが続きます。このアーキテクチャはPCAネットワーク(PCANet)と呼ばれ、非常に簡単にかつ効率的に設計および学習することができます。比較と理解のため、PCANetの2つの単純なバリエーションであるRandNetとLDANetについても紹介し、研究を行いました。これらはPCANetと同じトポロジーを持ちますが、連続するフィルタはランダムに選択されるか、LDAから学習されます。私たちはこれらの基本的なネットワークを多くのベンチマーク視覚データセットで広範囲にテストしました。具体的には、顔認証用のLFWデータセットや顔認識用のMultiPIE、Extended Yale B、AR、FERETデータセットなどがあり、手書き数字認識用のMNISTデータセットも含まれています。驚くべきことに、すべてのタスクにおいて、このような一見単純なPCANetモデルは最新の特徴量(事前に定義されたものや高度に手作業で調整されたもの、またはDNNによって慎重に学習されたもの)と同等の性能を示しました。さらに驚くべきことに、Extended Yale B, AR, FERETデータセットやMNIST変種での多くの分類タスクにおいて新しい記録を樹立しています。その他の公開データセットでの追加実験でも、PCANetがテクスチャ分類や物体認識における単純ながら非常に競争力のあるベースラインとして機能する可能性が示されました。

PCANet: 画像分類のためのシンプルな深層学習ベースライン | 最新論文 | HyperAI超神経