
要約
リモートセンシング(RS)シーン分類は、環境モニタリングや地質調査など幅広い分野で応用されている。実際の応用において、衛星によって撮影されたRSシーン画像は、晴天環境と曇天環境の2つの状況に分けられる。しかし、従来の多くの手法は、これらの2つの環境を同時に考慮していない。本研究では、晴天環境および曇天環境のいずれにおいても、グローバル特徴とローカル特徴が識別的な性質を持つと仮定する。近年の畳み込みニューラルネットワーク(CNN)ベースのモデルは、画像分類において優れた成果を上げているが、ネットワーク構造上、グローバル特徴とローカル特徴の両方を十分に捉えることに若干の盲点があった。本論文では、グローバルエンコーダとローカルエンコーダを備えた新たなCNNベースのネットワーク(GLNet)を提案する。このネットワークは、RSシーン分類に適した識別的なグローバル特徴とローカル特徴を効果的に抽出することを目的としており、トレーニング過程においてクラス間分散の拡大とクラス内コンパクト性の確保という制約を組み込んでいる。公開されている2つのRSシーン分類データセットを用いた実験結果から、晴天および曇天の両環境下において、多数の既存CNNバックボーンを用いた場合と比較して、提案手法GLNetが優れた性能を達成することが確認された。