Command Palette
Search for a command to run...
RefineNet:高解像度セマンティックセグメンテーションのためのマルチパスリファインメントネットワーク
RefineNet:高解像度セマンティックセグメンテーションのためのマルチパスリファインメントネットワーク
Lin Guosheng Milan Anton Shen Chunhua Reid Ian
概要
近年、非常に深い畳み込みニューラルネットワーク(CNN)は、物体認識において優れた性能を発揮しており、セマンティックセグメンテーションをはじめとする密な分類問題における第一の選択肢となっている。しかし、深層CNNにおけるプーリングや畳み込みのストライドといった繰り返しのダウンサンプリング操作により、元画像の解像度が著しく低下してしまうという問題がある。本研究では、ダウンサンプリング過程で得られるすべての情報を明示的に活用し、長距離のリジッド接続を用いて高解像度の予測を可能にする汎用的なマルチパス精緻化ネットワーク「RefineNet」を提案する。このアプローチにより、高レベルの意味的特徴を捉える深層の層は、初期の畳み込み層から得られる細粒度特徴を直接用いて精緻化できる。RefineNetの各構成要素は、アイデンティティマッピングの思想に基づいたリジッド接続を採用しており、効果的なエンドツーエンド学習が可能となる。さらに、チェーン式リジッドプーリング(chained residual pooling)を導入することで、効率的に豊かな背景コンテキストを捉えることが可能になった。広範な実験を通じて、7つの公開データセットにおいて新たな最先端の成果を達成した。特に、難易度の高いPASCAL VOC 2012データセットにおいて、交差和(intersection-over-union)スコア83.4を達成し、これまでに報告された最高の結果となった。