2ヶ月前
RefineNet: 高解像度セマンティックセグメンテーションのためのマルチパスリファイメントネットワーク
Lin, Guosheng ; Milan, Anton ; Shen, Chunhua ; Reid, Ian

要約
最近、非常に深い畳み込みニューラルネットワーク(CNN)は物体認識において優れた性能を示し、セマンティックセグメンテーションなどの密集分類問題の首选択肢となっています。しかし、深層CNNにおけるプーリングや畳み込みストライドなどの反復的なダウンサンプリング操作により、初期画像の解像度が大幅に低下する傾向があります。本稿では、そのようなダウンサンプリング過程で利用可能なすべての情報を明示的に活用し、長距離残差接続を使用して高解像度予測を可能にする汎用マルチパスリファインメントネットワークであるRefineNetを提案します。これにより、高レベルの意味特徴を捉える深い層が、初期の畳み込みから得られる細かい特徴によって直接改良されることが可能となります。RefineNetの各構成要素はアイデンティティマッピングの考え方に基づいた残差接続を採用しており、効果的なエンドツーエンド学習が可能です。さらに、連鎖型残差プーリング(chained residual pooling)を導入することで、効率的に豊富な背景コンテクストを捉えることができます。私たちは包括的な実験を行い、7つの公開データセットで新しい最先端の結果を達成しました。特に、困難なPASCAL VOC 2012データセットにおいて83.4の交差比(intersection-over-union)スコアを達成し、これは現在までに報告された最高の結果です。