2ヶ月前

深層畳み込みネットワークと完全結合CRFを用いた意味的画像セグメンテーション

Liang-Chieh Chen; George Papandreou; Iasonas Kokkinos; Kevin Murphy; Alan L. Yuille
深層畳み込みネットワークと完全結合CRFを用いた意味的画像セグメンテーション
要約

深層畳み込みニューラルネットワーク(DCNN)は最近、画像分類や物体検出などの高レベルの視覚タスクにおいて最先端の性能を示しています。本研究では、DCNNと確率的グラフィカルモデルの手法を組み合わせて、ピクセルレベルの分類(「セマンティック画像セグメンテーション」とも呼ばれます)の課題に取り組んでいます。我々は、DCNNの最終層での応答が正確な物体セグメンテーションには十分に局所化されていないことを示しました。これは、DCNNが高レベルのタスクに適している不変性特性によるものです。我々は、この深層ネットワークの局所化特性の不足を克服するために、最終DCNN層での応答と完全結合条件付き隨機場(CRF)を組み合わせました。定性的には、「DeepLab」システムは以前の手法を超える精度でセグメント境界を局所化することができます。定量的には、当手法はPASCAL VOC-2012セマンティック画像セグメンテーションタスクにおいて新たな最先端となり、テストセットで71.6%のIOU精度を達成しました。また、これらの結果を効率的に得る方法についても説明します:慎重なネットワーク再利用とウェーブレットコミュニティから導入した「ホール」アルゴリズムの新規応用により、現代のGPU上で秒間8フレームでニューラルネットワーク応答の密集計算が可能となりました。

深層畳み込みネットワークと完全結合CRFを用いた意味的画像セグメンテーション | 最新論文 | HyperAI超神経