2ヶ月前
100層のティラミス:意味的セグメンテーションのための完全畳み込みDenseNets
Simon Jégou; Michal Drozdzal; David Vazquez; Adriana Romero; Yoshua Bengio

要約
最新の意味分割手法は、畳み込みニューラルネットワーク(CNNs)に基づいて構築されています。典型的なセグメンテーションアーキテクチャは、(a) 粗い意味特徴を抽出するダウンサンプリングパス、(b) モデルの出力で入力画像の解像度を復元するためのアップサンプリングパス、およびオプションで (c) モデルの予測を洗練するための後処理モジュール(例:条件付き確率場)から構成されています。最近、新しいCNNアーキテクチャである密集接続畳み込みネットワーク(DenseNets)が画像分類タスクにおいて優れた結果を示しています。DenseNetsのアイデアは、各層が順方向に他のすべての層と直接接続されている場合、ネットワークはより正確かつ学習しやすくなるという観察に基づいています。本論文では、DenseNetsを意味分割問題に拡張しました。CamVidやGatechなどの都市シーンベンチマークデータセットにおいて、追加の後処理モジュールや事前学習なしで最先端の結果を達成しました。さらに、モデルの巧妙な構築により、これらのデータセットに対する現在公開されている最良のエントリよりも大幅に少ないパラメータ数を実現しています。実験を再現するためのコードは以下のURLから入手可能です: https://github.com/SimJeg/FC-DenseNet/blob/master/train.py