17日前

PushPull-Net:画像のノイズに強い抑制駆動型ResNet

Guru Swaroop Bennabhaktula, Enrique Alegre, Nicola Strisciuglio, George Azzopardi
PushPull-Net:画像のノイズに強い抑制駆動型ResNet
要約

我々は、一次視覚皮質における反位相抑制現象に着想を得て、ResNetアーキテクチャの最初の層に新たな計算ユニット「PushPull-Conv」を提案する。このユニットは従来の畳み込み層を再定義し、学習可能な「プッシュカーネル」とその補完的な「プルカーネル」のペアを実装する。プッシュカーネル(従来の畳み込みと同様)は特定の刺激に対して応答を学習する一方、プルカーネルは同じ刺激だが反対のコントラストに対して反応する。この構成により、刺激選択性が向上し、好みの刺激が存在しない領域における応答が効果的に抑制される。この効果は、プッシュカーネルとプルカーネルがその領域で同程度の応答を生じ、互いに相殺するためである。PushPull-ConvをResNetに組み込むことで、画像の劣化に対するモデルのロバスト性が著しく向上する。標準的な劣化データセットを用いた実験の結果、PushPull-Convは他のデータ拡張技術と組み合わせることで、さらにモデルのロバスト性を向上させることができることが示された。特に、PRIME拡張とPushPull抑制を併用した場合、ResNet50はImageNet-C上でmCE(mean Corruption Error)49.95%という新たなロバスト性のベンチマークを達成した。

PushPull-Net:画像のノイズに強い抑制駆動型ResNet | 最新論文 | HyperAI超神経