Command Palette
Search for a command to run...
深層学習モデルの土地被覆画像分類におけるベンチマークおよびスケーリング
深層学習モデルの土地被覆画像分類におけるベンチマークおよびスケーリング
Ioannis Papoutsis Nikolaos-Ioannis Bountos Angelos Zavras Dimitrios Michail Christos Tryfonopoulos
概要
コペルニクス・センチネル-2(Copernicus Sentinel-2)画像の膨大な量の利用可能性が、土地利用・土地被覆(LULC)画像分類に深層学習(DL)手法を活用する新たな機会を創出している。しかし、現在では、同一データセット上で同一の評価指標と一貫した環境、および同一のハードウェア条件下で検証された広範なベンチマーク実験が不足している。本研究では、BigEarthNet Sentinel-2データセットを用いて、マルチラベル・マルチクラスLULC画像分類問題に対する最先端のDLモデルを初めて体系的にベンチマーク化し、60の訓練済みモデルから構成される包括的なモデルコレクションを提供する。本ベンチマークには標準的な畳み込みニューラルネットワーク(CNN)に加え、非畳み込み型手法も含まれており、EfficientNetsやWide Residual Networks(WRN)のアーキテクチャを実証的に評価。分類精度、学習時間、推論速度といった指標を用いて性能を比較した。さらに、軽量WRNモデルに対してEfficientNetフレームワークを用いた複合スケーリング(compound scaling)を提案。効率的なチャネル注意機構(Efficient Channel Attention)を組み合わせることで、スケーリングされた軽量モデルは新たな最先端性能を達成した。標準的なResNet50ベースラインモデルと比較して、19のLULCクラス全体の平均Fスコアで4.5%高い分類精度を実現しながら、学習可能なパラメータ数は1桁以上削減された。本研究では、すべての訓練済みモデルと複数GPUノードにおける分散学習用コードを公開している。この事前学習済みエンコーダのモデル図鑑は、ImageNetなど異なるドメインのデータで学習されたバックボーンモデルに依存するのではなく、Sentinel-2データを用いるさまざまなリモートセンシングタスクにおける転移学習や迅速なプロトタイピングに活用可能である。異なる規模の複数のデータセットを用いた実験により、これらのモデルが転移学習に適していることを検証した。特に、トップパフォーマンスを示したWRNモデルは、訓練データセットのわずか一部にのみ接触した状態で、SEN12MSデータセットにおいて71.1%のFスコアという最先端の性能を達成した。