17日前

動的領域認識型畳み込み

Jin Chen, Xijun Wang, Zichao Guo, Xiangyu Zhang, Jian Sun
動的領域認識型畳み込み
要約

我々は、特徴量が類似した表現を持つ空間領域に自動的に複数のフィルタを割り当てることができる新しい畳み込み演算「Dynamic Region-Aware Convolution(DRConv)」を提案する。このアプローチにより、DRConvは従来の畳み込みと比較して、意味的変化のモデリングにおいて優れた性能を発揮する。従来の畳み込み層では、より多くの視覚的要素を抽出するためにフィルタ数を増やすが、その結果、計算コストが著しく上昇する。これに対して、DRConvは学習可能なインストラクタを用いて、チャンネル方向のフィルタ増加を空間次元へと移行する。これにより、畳み込みの表現力が向上するだけでなく、従来の畳み込みと同様に計算コストと並進不変性(translation-invariance)を維持することができる。DRConvは、複雑かつ変動する空間情報分布に対処するための効果的かつ洗練された手法であり、既存ネットワークの任意の場所に即座に挿入可能(plug-and-play)であるため、特に効率的なネットワークにおける畳み込み層の強化に適している。本手法は、MobileNetシリーズ、ShuffleNetV2など多様なモデルおよび分類、顔認識、検出、セグメンテーションといった幅広いタスクにおいて評価された。ImageNet分類タスクにおいて、DRConvを搭載したShuffleNetV2-0.5xは、46Mの乗加算(multiply-adds)レベルで67.1%のトップ性能を達成し、相対的な改善率6.3%を実現した。

動的領域認識型畳み込み | 最新論文 | HyperAI超神経