要約
地理空間オブジェクトセグメンテーションは、地球ビジョンの基本的なタスクとして、高空間分解能(HSR)リモートセンシング画像において、スケールの変動、背景のクラス内ばらつきの大きさ、および前景と背景の不均衡という課題に常に直面している。一般的なセマンティックセグメンテーション手法は、自然画像におけるスケール変動に主に注目しているが、大範囲の地球観測シーンでは、残りの2つの問題——背景のクラス内ばらつきと前景・背景の不均衡——は十分に考慮されていない。本論文では、関係ベース、最適化ベース、オブジェクト性ベースの観点から前景を意識した関係ネットワーク(FarSeg++)を提案する。関係の観点から、前景-シーン関係モジュールにより、オブジェクト-シーン関係に関連する前景に関連するコンテキストを活用することで、前景特徴の識別能を向上させる。最適化の観点からは、トレーニング中に前景サンプルおよび背景の困難サンプルに注目する前景意識型最適化を提案し、バランスの取れた最適化を実現する。さらに、オブジェクト性の観点からは、オブジェクト性表現を強化する前景意識型デコーダを導入し、実証的な上限境界解析によって明らかにされた主なボトルネックであるオブジェクト性予測の問題を緩和する。また、本手法の有効性を検証するため、新たな大規模高解像度都市車両セグメンテーションデータセットを提案し、オブジェクト性予測の発展をさらに推進する。実験結果から、FarSeg++は最先端の汎用セマンティックセグメンテーション手法を上回り、速度と精度の間でより優れたトレードオフを達成できることを示している。