2ヶ月前
DSNet: セマンティックセグメンテーションにおけるアトラス畳み込みの新しい利用方法
Zilu Guo; Liuyang Bian; Xuan Huang; Hu Wei; Jingyu Li; Huasheng Ni

要約
アトラス畳み込みは、セマンティックセグメンテーションタスクにおいて受容野を拡大する手法として用いられています。しかし、従来のセマンティックセグメンテーションの研究では、この手法がモデルの浅層でほとんど使用されていませんでした。本研究では、現代の畳み込みニューラルネットワーク(CNN)におけるアトラス畳み込みの設計を見直し、大きなカーネルを使用してアトラス畳み込みを適用するという概念がより強力なパラダイムであることを示します。私たちは、アトラス畳み込みをより効率的に適用するための3つのガイドラインを提案します。これらのガイドラインに従って、私たちはDSNetと呼ばれる双方向CNNアーキテクチャを提案します。このアーキテクチャは、モデルの浅層にアトラス畳み込みを取り入れるとともに、エンコーダーのほぼ全体をImageNetで事前学習させることで性能向上を目指しています。我々の手法の有効性を示すために、提案したモデルはADE20K、CityscapesおよびBDDデータセットにおいて精度と速度の新しい最先端トレードオフを達成しました。具体的には、DSNetはADE20Kで推論速度179.2 FPSで40.0% mIOU(平均交差率)、Cityscapesでは81.9 FPSで80.4% mIOUを達成しています。ソースコードとモデルはGitHub(https://github.com/takaniwa/DSNet)から入手可能です。