4ヶ月前

大規模カーネルの重要性 -- グローバル畳み込みネットワークによるセマンティックセグメンテーションの改善

Chao Peng; Xiangyu Zhang; Gang Yu; Guiming Luo; Jian Sun
大規模カーネルの重要性 -- グローバル畳み込みネットワークによるセマンティックセグメンテーションの改善
要約

最近のネットワークアーキテクチャ設計の傾向の一つは、計算量が同じである場合、大規模なカーネルよりも効率的な小さなフィルタ(例:1x1や3x3)を全体に積み重ねることです[30, 31, 14]。しかし、画素単位での密集した予測が必要なセマンティックセグメンテーションの分野では、分類と位置特定を同時に実行する際、大規模なカーネル(および有効受容野)が重要な役割を果たすことがわかりました。当社の設計原則に基づき、これらの課題に対処するためにグローバル畳み込みネットワーク(Global Convolutional Network)を提案します。また、残差ベースの境界精緻化(residual-based boundary refinement)も提唱し、物体の境界をさらに洗練することを目指しています。本手法は2つの公開ベンチマークで最先端の性能を達成し、PASCAL VOC 2012データセットでは82.2%(対80.2%)、Cityscapesデータセットでは76.9%(対71.8%)という結果で従来の手法を大幅に上回りました。