
要約
本稿では、単一パスによる意味的セグメンテーションを実現する、エンドツーエンドで学習可能な深層エンコーダデコーダアーキテクチャを提案する。本手法は、特徴レベルにおける長距離スキップ接続を有するカスケード構造に基づいている。エンコーダはResNeXtの残差ブロック構造を採用し、同一トポロジーを持つ複数の変換を統合するブロックを繰り返し適用する戦略を用いている。デコーダは、新たなアーキテクチャを採用しており、以下の3つの機能を備えたブロックから構成される:(i)文脈情報を捉える、(ii)意味的特徴を生成する、(iii)異なる出力解像度間の特徴融合を可能にする。特に、デコーダブロックがすべての前のデコーダレベル、すなわちすべての高レベル特徴マップから得られる意味的特徴マップを活用できるように、密度型のデコーダショートカット接続を導入している。この密度型のデコーダ接続により、デコーダブロック間における効果的な情報伝達が可能となり、多段階の特徴融合が実現され、精度の大幅な向上が達成される。重要な点として、本手法は、従来の研究で行われていた時間的に重いマルチスケール平均処理を必要とせずに、いくつかの困難なデータセットにおいて最先端の性能を達成できることを示している。