
要約
高スペクトル画像は空間的およびスペクトル的な情報を豊富に含んでおり、3次元畳み込みニューラルネットワーク(3D-CNN)を用いることで、空間次元とスペクトル次元の特徴を同時に抽出し、特徴の分類を促進できる。しかし、高スペクトル画像にはスペクトル次元における情報の冗長性が存在する。連続的な3D-CNNの使用はパラメータ量を大幅に増加させ、デバイスの計算能力要件を高め、学習に長時間を要するという問題を引き起こす。本稿では、これらの課題をバランスよく解決するため、高速選択的カーネル機構ネットワーク(Faster Selective Kernel Network, FSKNet)を提案する。FSKNetは、3D-CNNと2D-CNNの相互変換モジュールを設計し、3D-CNNを用いて特徴抽出を行う一方で、空間的およびスペクトル的次元の次元削減を実現する。しかし、このようなモデルは依然として軽量化が不十分である。変換後の2D-CNNにおいて、選択的カーネル機構を導入し、各ニューロンが双方向入力情報のスケールに基づいて受容 field のサイズを動的に調整可能にする。選択的カーネル機構は主に2つの構成要素からなる:SEモジュール(チャンネル次元の注目度を獲得)と可変畳み込み(地物の空間的形状変形情報を取得)。この機構により、モデルはより高い精度を実現しつつ、高速かつ計算負荷が低い特性を有する。FSKNetは、IN、UP、Salinas、Botswanaの各データセットにおいて、極めて少ないパラメータ数で高い分類精度を達成した。