17日前

SuperYOLO:マルチモーダルリモートセンシング画像におけるスーパーレゾリューション支援型オブジェクト検出

Jiaqing Zhang, Jie Lei, Weiying Xie, Zhenman Fang, Yunsong Li, Qian Du
SuperYOLO:マルチモーダルリモートセンシング画像におけるスーパーレゾリューション支援型オブジェクト検出
要約

リモートセンシング画像(RSI)から数十ピクセル程度のマルチスケール小物体を正確かつ迅速に検出することは、依然として困難な課題である。従来の多数の手法は、背景から分離された物体に対して強力な特徴表現を学習するため、複雑な深層ニューラルネットワークを主に設計しているが、これにより計算負荷が著しく増大する傾向にある。本論文では、マルチモーダルデータの融合と補助的スーパーレゾリューション(SR)学習を活用し、低解像度(LR)入力に基づいて高解像度(HR)特徴表現を学習することで、マルチスケール小物体に対する高精度な検出を実現する、高速かつ高精度なRSI向け物体検出手法「SuperYOLO」を提案する。まず、対称的かつコンパクトなマルチモーダル融合(MF)機構を用いて、異なるデータソースから補完情報を抽出し、RSIにおける小物体検出性能を向上させる。さらに、単純かつ柔軟なSRブランチを設計し、LR入力からHR特徴表現を学習することで、広大な背景と小物体の区別を高精度に可能にした。また、推論段階ではSRブランチを削除することで追加の計算コストを回避し、LR入力によるネットワーク計算量の削減を実現している。実験結果によると、広く用いられるVEDAI RSデータセットにおいて、SuperYOLOはmAP50で75.09%の検出精度を達成し、YOLOv5l、YOLOv5x、およびRS専用設計のYOLOrsといった最先端の大規模モデルと比較して10%以上高い性能を示した。さらに、SuperYOLOのパラメータ数とGFLOPsはYOLOv5xと比べてそれぞれ約18倍、3.8倍小さく、最先端モデルと比較して優れた精度-速度のトレードオフを実現している。本研究で提案するモデルの実装コードは、https://github.com/icey-zhang/SuperYOLO にてオープンソースとして公開される予定である。

SuperYOLO:マルチモーダルリモートセンシング画像におけるスーパーレゾリューション支援型オブジェクト検出 | 最新論文 | HyperAI超神経