要約
近年、地球観測における物体検出は著しい進展を遂げている。しかし、航空画像における微小物体の検出は依然として極めて困難な課題である。その理由は、微小物体が極めて少ない画素数で構成されており、背景と混同されやすいからである。航空画像における微小物体検出の研究を進めるために、本研究では「航空画像における微小物体検出用データセット(AI-TOD)」を提案する。具体的には、28,036枚の航空画像にわたって8つのカテゴリに分類される合計700,621個の物体インスタンスを含む。既存の航空画像用物体検出データセットと比較して、AI-TODにおける物体の平均サイズは約12.8画素と極めて小さく、他のデータセットと比べて顕著に小さい。航空画像における微小物体検出のベンチマークを構築するため、我々は提案したAI-TODデータセット上で最先端の物体検出器を評価した。実験結果から、これらの既存手法をAI-TODに直接適用しても最適な検出結果が得られないことが明らかになった。これにより、微小物体検出に特化した新たな検出器の設計が不可欠であることが示された。そこで、複数の中心点に基づく学習ネットワーク(M-CenterNet)を提案し、微小物体検出の局所化性能を向上させた。実験結果により、競合手法に対して顕著な性能向上が確認された。