11日前

マスクビューを用いたリモートセンシング変化検出の再考

Xiaowen Ma, Zhenkai Wu, Rongrong Lian, Wei Zhang, Siyang Song
マスクビューを用いたリモートセンシング変化検出の再考
要約

リモートセンシングにおける変化検出は、同一地域を異なる時刻に撮影された2枚以上の画像を比較し、地理的対象および環境要因の変化を定量的・定性的に評価することを目的としている。主流のモデルは通常、ピクセル単位の変化検出枠組みに基づいているが、複雑なシーンや撮影条件の変動による変化の多様性に対応できず、限界がある。この課題を克服するため、本稿ではマスク視点に基づく変化検出の再考を試み、以下の2つの新規アーキテクチャを提案する:1) メタアーキテクチャであるCDMask、および2) インスタンスネットワークとしてのCDMaskFormer。CDMaskの構成要素には、シアメーズバックボーン、変化抽出器、ピクセルデコーダ、トランスフォーマーデコーダ、および正規化検出器が含まれ、マスク検出フレームワークの適切な機能を保証する。変化クエリは二時相特徴の内容に基づいて適応的に更新可能であるため、提案するCDMaskは異なる潜在的データ分布に柔軟に対応でき、複雑なシナリオにおいても関心領域の変化を正確に同定可能である。さらに、変化検出タスクに特化したインスタンスネットワークとして、CDMaskFormerを提案する。その構成には以下の2つの要素が含まれる:(i) 時空間畳み込み注意力に基づくインスタンス化変化抽出器(空間的・時系列的文脈を軽量な演算で同時に捉える);(ii) シーン誘導型軸方向注意力を用いたインスタンス化トランスフォーマーデコーダ(より詳細な空間情報を抽出可能)。CDMaskFormerは5つのベンチマークデータセットにおいて最先端の性能を達成し、効率性と精度のバランスも良好である。コードは以下のURLで公開されている:https://github.com/xwmaxwma/rschange。

マスクビューを用いたリモートセンシング変化検出の再考 | 最新論文 | HyperAI超神経