2ヶ月前

DeepLab: 深層畳み込みネットワーク、アトラス畳み込み、および完全結合CRFを用いた意味的画像セグメンテーション

Liang-Chieh Chen; George Papandreou; Iasonas Kokkinos; Kevin Murphy; Alan L. Yuille
DeepLab: 深層畳み込みネットワーク、アトラス畳み込み、および完全結合CRFを用いた意味的画像セグメンテーション
要約

本研究では、ディープラーニングを用いた意味的画像セグメンテーションのタスクに取り組み、実験的にその実用的な価値が証明された3つの主要な貢献を行います。第一に、アップサンプリングされたフィルターを使用した畳み込み、または「アトロウス畳み込み」を濃密予測タスクにおける強力なツールとして強調します。アトロウス畳み込みは、深層畳み込みニューラルネットワーク(DCNN)内で特徴応答が計算される解像度を明示的に制御することを可能とします。また、パラメータ数や計算量を増加させることなく、フィルターの視野角を効果的に拡大してより広いコンテキストを取り込むことができます。第二に、複数スケールでの物体セグメンテーションを堅牢に行うためのアトロウス空間ピラミッドプーリング(ASPP)を提案します。ASPPは、複数のサンプリングレートと有効視野角でフィルターを使用して入力畳み込み特徴層を探査することで、物体だけでなく画像コンテキストも複数スケールで捉えることが可能です。第三に、DCNNと確率的グラフィカルモデルの手法を組み合わせて物体境界の局所化性能を向上させます。DCNNで一般的に使用される最大プーリングとダウンサンプリングの組み合わせは不変性を達成しますが、局所化精度には影響を与えます。これを克服するために、最終的なDCNN層での応答と完全結合条件付き随伴場(CRF)を組み合わせました。この方法は定性的および定量的に局所化性能の向上が示されています。我々が提案する「DeepLab」システムは、PASCAL VOC-2012意味的画像セグメンテーションタスクにおいて新たな最先端の成果を達成し、テストセットで79.7%のmIOU(平均交差比)を得ました。さらに、PASCAL-Context, PASCAL-Person-Part, Cityscapesという3つの他のデータセットでも結果を進展させています。我々のすべてのコードはオンラインで公開されています。