2ヶ月前

セマンティックセグメンテーションのためのフルコンボリューショナルネットワーク

Jonathan Long; Evan Shelhamer; Trevor Darrell
セマンティックセグメンテーションのためのフルコンボリューショナルネットワーク
要約

畳み込みネットワークは、階層的な特徴を生成する強力な視覚モデルです。本研究では、エンドツーエンドで訓練されたピクセルからピクセルへの畳み込みネットワークが意味分割において最先端の性能を上回ることを示しています。我々の主要な洞察は、「完全に畳み込み」ネットワークを構築することであり、このネットワークは任意のサイズの入力を取り、効率的な推論と学習により対応するサイズの出力を生成します。完全に畳み込みネットワークの空間を定義し詳細に説明し、その空間的に密集した予測タスクへの適用方法について解説するとともに、先行モデルとの関連性も指摘します。現代の分類ネットワーク(AlexNet、VGG_net、GoogLeNet)を完全に畳み込みネットワークに適応させ、微調整によって学習された表現をセグメンテーションタスクに転移させます。さらに、深い粗い層からの意味情報を浅い細かい層からの外観情報と組み合わせて正確かつ詳細なセグメンテーションを生成する新しいアーキテクチャを定義します。我々の完全に畳み込みネットワークはPASCAL VOC(2012年の平均IUで20%相対改善して62.2%)、NYUDv2、SIFT Flowでの最先端のセグメンテーション性能を達成しており、典型的な画像に対する推論時間は約3分の1秒となっています。

セマンティックセグメンテーションのためのフルコンボリューショナルネットワーク | 最新論文 | HyperAI超神経