
要約
本稿では、航空画像のセマンティックセグメンテーションを目的として、U-Netアーキテクチャの改善された学習プロトコルを提案する。我々は、難易度の高いFLAIR #2データセットを用いて提案手法の有効性を検証した。また、各アプローチの構成要素が全体的な性能に与える影響を広範にわたって解析するアブレーションスタディを実施した。このアブレーションスタディでは、異なるモデルバックボーン、画像拡張手法、学習率スケジューラ、損失関数、および学習プロシージャの比較を含む。さらに、二段階学習プロトコルを提案し、モデルアンサンブルの異なる選択肢についても評価を行った。得られた結果をもとに、最終的なモデル学習プロトコルの設定を構築した。この最終的な設定により、相対誤差は約18%低減され、mIoUは0.641を達成し、新たな最先端(state-of-the-art)の結果を記録した。本研究のコードは以下のURLから公開されている:https://github.com/strakaj/U-Net-for-remote-sensing