2ヶ月前
意味画像分割のためのアトラス畳み込みの再考
Chen, Liang-Chieh ; Papandreou, George ; Schroff, Florian ; Adam, Hartwig

要約
本研究では、画像のセマンティックセグメンテーションに応用される深層畳み込みニューラルネットワーク(DCNN)において、フィルターの視野角を明示的に調整し、特徴応答の解像度を制御する強力なツールであるアトラス畳み込み(atrous convolution)を見直します。異なるスケールでの物体分割問題に対処するために、複数のアトラス率を採用して多スケールコンテキストを捉えるためのカスケードまたは並列でアトラス畳み込みを使用するモジュールを設計しました。さらに、以前に提案したアトラス空間ピラミッドプーリング(Atrous Spatial Pyramid Pooling)モジュールを拡張し、多スケールで畳み込み特徴を探査するとともに、全体的なコンテキストをエンコードする画像レベル特徴を追加することで性能向上を目指します。また、実装の詳細について説明し、システムの学習に関する経験も共有します。提案された「DeepLabv3」システムは、DenseCRF後処理なしで以前のDeepLabバージョンよりも大幅に改善され、PASCAL VOC 2012 セマンティック画像セグメンテーションベンチマークにおいて他の最先端モデルと同等の性能を達成しています。