
要約
最近の意味分割における進展は、フルコンボリューショナルネットワーク(FCNs)における空間解像度の向上によって推進されてきました。この問題に対処するため、我々は意味分割用のスタック型デコンボリューショナルネットワーク(Stacked Deconvolutional Network: SDN)を提案します。SDNでは、複数の浅いデコンボリューショナルネットワーク(これをSDNユニットと呼びます)が順次積み重ねられ、文脈情報を統合し、位置情報の精密な復元を保証します。さらに、ユニット間およびユニット内の接続が設計され、これらの接続により情報と勾配伝播の流れが改善され、ネットワーク学習を支援し、特徴量融合を強化します。また、各SDNユニットのアップサンプリングプロセス中に階層的な監督が適用され、これにより特徴表現の識別性が保証され、ネットワーク最適化に寄与します。我々は包括的な実験を行い、PASCAL VOC 2012, CamVid, GATECH の3つのデータセットで最新の最先端結果を達成しました。特に、条件随伴場(CRF)後処理なしで最良モデルはテストセットにおいて86.6%の交差率-合併率スコア(Intersection-over-Union Score)を達成しています。