2ヶ月前

セマンティック画像セグメンテーションのためのアトラス分離畳み込みを用いたエンコーダー-デコーダー構造

Liang-Chieh Chen; Yukun Zhu; George Papandreou; Florian Schroff; Hartwig Adam
セマンティック画像セグメンテーションのためのアトラス分離畳み込みを用いたエンコーダー-デコーダー構造
要約

空間ピラミッドプーリングモジュールやエンコーダー-デコーダー構造は、深層ニューラルネットワークにおけるセマンティックセグメンテーションタスクで使用されています。前者のネットワークは、複数のレートと効果的な視野でフィルターまたはプーリング操作を適用することで、多尺度のコンテキスト情報を符号化することができます。後者のネットワークは、空間情報を段階的に復元することにより、より鮮明なオブジェクト境界を捉えることができます。本研究では、これらの手法の長所を組み合わせることを提案します。特に、提案するモデルであるDeepLabv3+は、単純かつ効果的なデコーダーモジュールを追加することで、DeepLabv3を拡張し、特にオブジェクト境界に沿ったセグメンテーション結果の精度向上に寄与します。さらに、Xceptionモデルを探求し、Atrous Spatial Pyramid Pooling(ASPP)およびデコーダーモジュールに深度別分離畳み込みを適用しました。これにより、より高速で強力なエンコーダー-デコーダーネットワークが実現されました。PASCAL VOC 2012およびCityscapesデータセットでの評価結果から、提案モデルの有効性を示しており、ポストプロセッシングなしでテストセット性能89.0%および82.1%を達成しています。本論文では、Tensorflowを使用した提案モデルの公開リファレンス実装も提供しています(\url{https://github.com/tensorflow/models/tree/master/research/deeplab})。

セマンティック画像セグメンテーションのためのアトラス分離畳み込みを用いたエンコーダー-デコーダー構造 | 最新論文 | HyperAI超神経