17日前

高解像度リモートセンシング画像のセマンティックセグメンテーションのためのマルチアテンションネットワーク

{Peter M. Atkinson, Libo Wang, Jianlin Su, Chenxi Duan, Ce Zhang, Shunyi Zheng, Rui Li}
要約

リモートセンシング画像の意味的セグメンテーションは、土地資源管理、生物圏モニタリング、都市計画など広範な応用分野において重要な役割を果たしている。深層畳み込みニューラルネットワーク(CNN)の導入により、リモートセンシング画像における意味的セグメンテーションの精度は著しく向上しているが、従来のモデルにはいくつかの制限が存在する。第一に、U-Netなどのエンコーダ-デコーダアーキテクチャでは、マルチスケール特徴量の利用に伴い、情報の未活用が生じている。具体的には、低レベル特徴量と高レベル特徴量が直接連結されるが、その過程で精緻な特徴の再調整が行われない。第二に、特徴マップの長距離依存性が十分に捉えられておらず、各意味的クラスに関連する特徴表現が最適化されていない。第三に、長距離依存性をモデル化するためのドット積アテンション機構が意味的セグメンテーションに導入されているものの、アテンション機構に伴う大きな時間的・空間的計算負荷が、大規模な入力データを扱う実用的応用シーンにおけるアテンションの活用を妨げている。本研究では、複数の効率的なアテンションモジュールを用いて文脈的依存関係を抽出するマルチアテンションネットワーク(MANet)を提案する。特に、線形計算量(線形複雑度)を有する新しいアテンションメカニズム「カーネルアテンション」を導入し、アテンション処理に伴う膨大な計算負荷を軽減する。カーネルアテンションとチャネルアテンションを統合し、ResNet-50によって抽出された局所的特徴マップとその対応するグローバル依存関係を融合し、相互に依存するチャネルマップを適応的に再重み付けする。本手法は、2つの大規模な高解像度リモートセンシングデータセットを用いた数値実験により、優れた性能を示した。実装コードは、https://github.com/lironui/Multi-Attention-Network で公開されている。

高解像度リモートセンシング画像のセマンティックセグメンテーションのためのマルチアテンションネットワーク | 最新論文 | HyperAI超神経