Command Palette
Search for a command to run...
意味画像分割のためのアトロス畳み込みの再考
意味画像分割のためのアトロス畳み込みの再考
Chen Liang-Chieh Papandreou George Schroff Florian Adam Hartwig
概要
本研究では、深層畳み込みニューラルネットワークが計算する特徴応答の解像度を制御するとともに、フィルタの視野(field-of-view)を明示的に調整できる強力な手法であるアトラス畳み込み(atrous convolution)を、意味画像セグメンテーションへの応用において再検討する。複数スケールのオブジェクトを正確にセグメンテーションする問題に対処するため、複数のアトラス率を用いて多スケールの文脈情報を捉えることを目的として、アトラス畳み込みを直列(cascade)または並列(parallel)に組み合わせたモジュールを設計した。さらに、以前に提案したアトラス空間ピラミッドプーリング(Atrous Spatial Pyramid Pooling)モジュールに、グローバルな文脈情報を编码する画像レベルの特徴量を追加することで、性能のさらなる向上を図った。本研究では、システムの実装細則についても詳細に説明し、学習における経験を共有する。提案する「DeepLabv3」システムは、DenseCRFの後処理を用いない前バージョンのDeepLabと比較して顕著な性能向上を達成し、PASCAL VOC 2012の意味画像セグメンテーションベンチマークにおいて、他の最先端モデルと同等の性能を達成している。