17日前
二重グラフ畳み込みネットワークを用いたセマンティックセグメンテーション
Li Zhang, Xiangtai Li, Anurag Arnab, Kuiyuan Yang, Yunhai Tong, Philip H.S. Torr

要約
ピクセル単位の予測タスク、特にセマンティックセグメンテーションにおいて、長距離の文脈情報を活用することは極めて重要である。従来のマルチスケール特徴の融合や拡張畳み込み(dilated convolutions)とは異なり、本研究ではこの問題に対処するための新しいグラフ畳み込みネットワーク(GCN)を提案する。本研究で提唱する二重グラフ畳み込みネットワーク(DGCNet)は、単一のフレームワーク内で互いに直交する2つのグラフをモデル化することで、入力特徴のグローバルな文脈を捉える。第一の構成要素は画像内のピクセル間の空間的関係をモデル化し、第二の構成要素はネットワークの特徴マップにおけるチャネル次元における相互依存関係をモデル化する。この手法は、特徴を低次元の新たな空間に投影することで、すべてのペアワイズ相互作用を効率的に表現した後、元の空間に再投影することによって実現される。本手法はシンプルでありながら、強力なベースラインに対して顕著な性能向上をもたらし、Cityscapesデータセット(平均IoU 82.0%)およびPascal Contextデータセット(平均IoU 53.7%)の両方で最先端の結果を達成した。コードおよびモデルは、さらなる研究を促進するため公開されている(\url{https://github.com/lxtGH/GALD-DGCNet})。