17日前

Depthwise Separable Convolutionの再考:Intra-Kernel相関がMobileNetの性能向上に与える影響

Daniel Haase, Manuel Amthor
Depthwise Separable Convolutionの再考:Intra-Kernel相関がMobileNetの性能向上に与える影響
要約

本稿では、CNNの高効率な構成要素として、ブループリント分離畳み込み(Blueprint Separable Convolutions, BSConv)を提案する。本手法は、学習済みモデルから得られたカーネル特性の定量的分析に基づいており、その結果、深さ方向(depth axis)に沿った相関関係が支配的であることが明らかになった。これらの知見をもとに、標準的な層のみを用いた効率的な実装を導く理論的基盤を構築した。さらに、本アプローチは、近年の多くの現代的ネットワークアーキテクチャの基盤となっている深度方向分離畳み込み(Depthwise Separable Convolutions, DSCs)の適用について、包括的な理論的導出、解釈および正当化を提供する。最終的に、DSCに基づくアーキテクチャ(例:MobileNets)が暗黙のうちにカーネル間相関(cross-kernel correlations)に依存している一方で、本研究のBSConvはカーネル内相関(intra-kernel correlations)に基づくため、通常の畳み込みのより効率的な分離を可能にする。大規模かつ細分化された分類データセットにおける広範な実験により、BSConvは追加の複雑性を導入することなく、MobileNetや他のDSCベースアーキテクチャを明確かつ一貫して向上させることを示した。特に細分化データセットでは、最大で13.7パーセンテージポイントの性能向上を達成した。また、ResNetなどの標準アーキテクチャへの即時置換(drop-in replacement)として用いた場合、ImageNet上でも従来のバージョンを最大9.5パーセンテージポイント上回る性能を発揮した。コードおよびモデルは、https://github.com/zeiss-microscopy/BSConv にて公開されている。

Depthwise Separable Convolutionの再考:Intra-Kernel相関がMobileNetの性能向上に与える影響 | 最新論文 | HyperAI超神経