2ヶ月前
RedNet: 室内RGB-Dセマンティックセグメンテーションのための残差エンコーダーデコーダーネットワーク
Jindong Jiang; Lunan Zheng; Fei Luo; Zhijun Zhang

要約
室内セマンティックセグメンテーションは、コンピュータビジョンにおける longstanding issue( longstanding issue )の一つです。本論文では、室内RGB-Dセマンティックセグメンテーションに向けたRGB-D残差エンコーダー-デコーダーアーキテクチャであるRedNetを提案します。RedNetにおいては、残差モジュールがエンコーダーとデコーダーの基本構成要素として使用され、スキップ接続がエンコーダーとデコーダー間の空間特徴をバイパスするために用いられます。シーンの深度情報を取り入れるため、RGB画像と深度画像をそれぞれで推論を行い、複数の層でそれらの特徴を融合する融合構造が構築されています。ネットワークのパラメータを効率的に最適化するためには、異なる層での教師あり学習を行う ピラミッド監督 ( pyramid supervision )トレーニングスキームを提案します。これにより勾配消失問題に対処することが可能となります。実験結果は、提案されたRedNet(ResNet-50)がSUN RGB-Dベンチマークデータセット上で最先端のmIoU精度47.8%を達成することを示しています。