2ヶ月前
解像度に応じたアトラス率の設計について - 意味的セグメンテーションネットワークにおける応用
Bum Jun Kim; Hyeyeon Choi; Hyeonah Jang; Sang Woo Kim

要約
DeepLabは、意味的セグメンテーションに広く使用されている深層ニューラルネットワークであり、その成功はアトラス空間ピラミッドプーリング(ASPP)と呼ばれる並列アーキテクチャに帰されます。ASPPは異なるアトラス率を持つ複数のアトラス畳み込みを使用して、局所情報と全局情報を抽出します。しかし、ASPPモジュールでは固定値のアトラス率が使用されており、これにより視野範囲のサイズが制限されています。原理的には、アトラス率はタスクやデータセットに応じて視野範囲のサイズを変更するハイパーパラメータであるべきですが、アトラス率の操作には具体的なガイドラインが存在しません。本研究では、最適なアトラス率を得るための実用的なガイドラインを提案します。まず、意味的セグメンテーションにおける効果的な受容野を導入し、セグメンテーションネットワークの内部動作を分析しました。ASPPモジュールの使用により効果的な受容野に特定のパターンが現れることを観察し、このパターンを追跡することでモジュールの基本的なメカニズムを明らかにしました。それに基づいて、入力画像のサイズに基づいて制御されるべき最適なアトラス率を得るための実用的なガイドラインを導き出しました。他の値と比較して、最適なアトラス率を使用することでSTARE, CHASE_DB1, HRF, Cityscapes, およびiSAIDデータセットなど複数のデータセットにおいて一貫してセグメンテーション結果が改善されました。