17日前

スカイスケイプス:航空シーンの細粒度セマンティック理解

{ Eleonora Vig, Arne Schumann, Lars Sommer, Corentin Henry, Seyed Majid Azimi}
スカイスケイプス:航空シーンの細粒度セマンティック理解
要約

センチメートル単位の精度で都市インフラの複雑な構造を理解することは、自動運転から地図作成、インフラ監視、都市管理に至る多くの応用において不可欠である。航空画像は広範囲にわたる情報を瞬時に提供する貴重な情報源であるが、現時点では、実世界の応用で求められる細粒度レベルまで航空シーンの複雑さを捉えたデータセットは存在しない。この課題に対応するため、本研究では、ピクセル単位のセマンティックラベリングに向けた高精度で細粒度なアノテーションを備えた航空画像データセット「SkyScapes」を提案する。SkyScapesは、建物、道路、植生といった大規模構造から、12の(準)カテゴリに分類される路線マークの細部までを含む、合計31のセマンティックカテゴリに対するアノテーションを提供している。本データセット上で、2つの主要なタスクを定義した:密なセマンティックセグメンテーションと多クラス路線マーク予測。SkyScapes上で最先端のセグメンテーション手法を広範に評価した結果、既存手法は多数のクラス、物体サイズ、スケール、および細部の変動に対応することが困難であることが明らかになった。そこで、セマンティックエッジ検出を統合した新たなマルチタスクモデルを提案し、多様なスケールからの特徴抽出に適した構造として設計した。このモデルは、両タスクにおいて、領域の輪郭と細部の再現性においてベースライン手法に比べて顕著な性能向上を達成した。