17日前

FactSeg: 大規模なリモートセンシング画像における小物体のセマンティックセグメンテーションを促進するフォアグラウンド活性化手法

{Zhuo Zheng, Yanfei Zhong, Junjue Wang, Ailong Ma}
要約

小物体のセマンティックセグメンテーションタスクは、高解像度リモートセンシング(HRS)画像から重要な物体を自動的に抽出することを目的としている。リモートセンシング画像の広域カバー範囲に比べて、HRS画像内の重要な物体(車両、船舶など)はしばしば数ピクセル程度に留まる。本論文では、この課題に対処するため、構造的視点および最適化的視点から、前景活性化(Foreground Activation, FA)を駆動とする小物体セマンティックセグメンテーション(FactSeg)フレームワークを提案する。構造設計においては、小物体に内在する微弱な特徴に対する認識を強化するため、FAオブジェクト表現を導入した。このFAオブジェクト表現フレームワークは、二本の分岐デコーダと協調確率(Collaborative Probability, CP)損失から構成される。二本の分岐デコーダにおいて、FA分岐は小物体特徴の活性化(activation)と大規模な背景の抑制を目的として設計され、一方、セマンティック精製(Semantic Refinement, SR)分岐は小物体のより明確な区別を図るための精製(refinement)を目的として設計されている。CP損失は、CP仮説の下で、デコーダの活性化出力と精製出力を効果的に統合することを目的として提案された。協調プロセスにおいて、小物体の微弱な特徴は活性化出力によって強化され、精製出力は二値出力の精緻化と見なすことができる。最適化ステージでは、小物体マイニング(Small Object Mining, SOM)に基づくネットワーク最適化を導入し、有効なサンプルを自動的に選択することで最適化の方向性を精緻化するとともに、小物体と大規模背景との間のサンプル不均衡問題に対処する。2つのベンチマークHRS画像セグメンテーションデータセットを用いた実験結果から、提案フレームワークが最先端のセマンティックセグメンテーション手法を上回り、精度と効率の間に良好なトレードオフを達成していることが示された。