
要約
私たちは、受容野内の局所パッチのモデル識別力を向上させるために、「Network In Network」(NIN)と呼ばれる新しい深層ネットワーク構造を提案します。従来の畳み込み層は、線形フィルタに非線形活性化関数を適用して入力データをスキャンしますが、代わりに私たちはより複雑な構造を持つマイクロニューラルネットワークを構築し、受容野内のデータを抽象化します。このマイクロニューラルネットワークには、強力な関数近似器である多層パーセプトロンを使用します。特徴マップは、CNNと同様に、マイクロネットワークを入力データ上にスライドさせて得られます。その後、これらの特徴マップは次の層へと入力されます。深層NINは、上記の構造を積み重ねることで実装できます。マイクロネットワークによる局所モデリングの向上により、分類層では特徴マップ上でグローバル平均プーリングを利用することが可能になります。これは、伝統的な全結合層よりも解釈が容易で、過学習に陥りにくいという利点があります。私たちはCIFAR-10およびCIFAR-100データセットにおいてNINを使用した最先端の分類性能を示し、SVHNおよびMNISTデータセットでも妥当な性能を得ました。