
要約
現代のインスタンスセグメンテーション手法の多くは、条件付きランダムフィールド、再帰型ニューラルネットワーク、オブジェクト提案、またはテンプレートマッチングスキームを含む複雑なパイプラインを使用しています。本論文では、この課題に取り組むための単純かつ強力なエンドツーエンドの畳み込みニューラルネットワークを提案します。当手法は、古典的なウォーターシェッド変換と現代の深層学習の直感を組み合わせて、オブジェクトインスタンスがエネルギー地図上で明確に表現されるような画像のエネルギー地図を生成します。その後、単一のエネルギーレベルでカットを行い、直接オブジェクトインスタンスに対応する連結成分を得ます。我々のモデルは、困難なCityscapes インスタンスレベルセグメンテーションタスクにおいて最先进技術の性能を2倍以上に向上させています。