Command Palette

Search for a command to run...

4ヶ月前

高解像度リモートセンシング画像のセマンティックセグメンテーションのためのマルチアテンションネットワーク

{Peter M. Atkinson Libo Wang Jianlin Su Chenxi Duan Ce Zhang Shunyi Zheng Rui Li}

要約

リモートセンシング画像の意味的セグメンテーションは、土地資源管理、生物圏モニタリング、都市計画など広範な応用分野において重要な役割を果たしている。深層畳み込みニューラルネットワーク(CNN)の導入により、リモートセンシング画像における意味的セグメンテーションの精度は著しく向上しているが、従来のモデルにはいくつかの制限が存在する。第一に、U-Netなどのエンコーダ-デコーダアーキテクチャでは、マルチスケール特徴量の利用に伴い、情報の未活用が生じている。具体的には、低レベル特徴量と高レベル特徴量が直接連結されるが、その過程で精緻な特徴の再調整が行われない。第二に、特徴マップの長距離依存性が十分に捉えられておらず、各意味的クラスに関連する特徴表現が最適化されていない。第三に、長距離依存性をモデル化するためのドット積アテンション機構が意味的セグメンテーションに導入されているものの、アテンション機構に伴う大きな時間的・空間的計算負荷が、大規模な入力データを扱う実用的応用シーンにおけるアテンションの活用を妨げている。本研究では、複数の効率的なアテンションモジュールを用いて文脈的依存関係を抽出するマルチアテンションネットワーク(MANet)を提案する。特に、線形計算量(線形複雑度)を有する新しいアテンションメカニズム「カーネルアテンション」を導入し、アテンション処理に伴う膨大な計算負荷を軽減する。カーネルアテンションとチャネルアテンションを統合し、ResNet-50によって抽出された局所的特徴マップとその対応するグローバル依存関係を融合し、相互に依存するチャネルマップを適応的に再重み付けする。本手法は、2つの大規模な高解像度リモートセンシングデータセットを用いた数値実験により、優れた性能を示した。実装コードは、https://github.com/lironui/Multi-Attention-Network で公開されている。

ベンチマーク

ベンチマーク方法論指標
semantic-segmentation-on-isprs-potsdamMANet
Overall Accuracy: 91.318
semantic-segmentation-on-isprs-vaihingenMANet
Overall Accuracy: 90.963

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
高解像度リモートセンシング画像のセマンティックセグメンテーションのためのマルチアテンションネットワーク | 論文 | HyperAI超神経