2ヶ月前

深層CNNがグローバル共分散プーリングと出会う:より良い表現と汎化能力

Qilong Wang; Jiangtao Xie; Wangmeng Zuo; Lei Zhang; Peihua Li
深層CNNがグローバル共分散プーリングと出会う:より良い表現と汎化能力
要約

既存の深層畳み込みニューラルネットワーク(CNN)におけるグローバル平均プーリングと比較して、グローバル共分散プーリングはより豊かな深層特徴の統計情報を捉えることができ、深層CNNの表現力や汎化能力を向上させる可能性があります。しかし、グローバル共分散プーリングを深層CNNに組み込むことは、以下の2つの課題をもたらします:(1) 高次元かつ小標本サイズの深層特徴に対する堅牢な共分散推定;(2) 共分散の幾何学的性質の適切な利用。これらの課題に対処するために、我々はグローバル行列冪乗正規化共分散(Matrix Power Normalized COVariance: MPN-COV)プーリングを提案します。我々のMPN-COVは堅牢な共分散推定器に準拠しており、高次元かつ小標本サイズの状況に非常に適しています。また、これは共分散間のパワーゆークリッド距離としても解釈でき、その幾何学的性質を効果的に活用できます。さらに、一次統計量をMPN-COVに組み込むために、グローバルガウス埋め込みネットワークを提案します。MPN-COVネットワークの高速な学習のために、GPUに非対応な固有値分解が内在するMPN-COVにおいて反復的な行列平方根正規化を実装しました。加えて、進行的な1x1畳み込みとグループ畳み込みが導入され、共分散表現を圧縮します。提案手法は非常にモジュール化されており、既存の深層CNNに容易に組み込むことができます。大規模物体分類、シーンカテゴリ化、細かい視覚認識およびテクスチャ分類に関する広範な実験が行われており、我々の手法が対応する手法を上回り最先端の性能を得ていることが示されています。