17日前
ぼやけたものから鮮明な検出へ:スーパーレゾリューションを活用したYOLOv5ベースの航空画像オブジェクト検出
Ragib Amin Nihal, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai

要約
無人機および衛星技術の広範な活用に伴い、航空画像における正確な物体検出の需要が急増している。従来の物体検出モデルは、大規模な物体に偏ったデータセットで学習されているため、小規模で密集して配置された物体が多数存在する航空画像環境では、最適な性能を発揮しづらい。この課題に対処するため、本研究では超解像技術と軽量化されたYOLOv5アーキテクチャの組み合わせを採用した革新的なアプローチを提案する。評価には、VisDrone-2023、SeaDroneSee、VEDAI、NWPU VHR-10といった複数のデータセットを用いた。本研究で提案する「超解像YOLOv5」アーキテクチャは、Transformerエンコーダブロックを導入することで、グローバルな文脈情報と局所的なコンテキスト情報を効果的に捉えることが可能となり、特に高密度かつ遮蔽が生じる状況下においても検出性能が向上する。この軽量モデルは、高い検出精度を実現するとともに、リソースの効率的な利用を確保しており、リアルタイム応用に適している。実験結果から、本モデルが小規模かつ密集配置された物体の検出において優れた性能を発揮することが明らかになった。特に、データセットの選定とアーキテクチャの適応がこのタスクにおいて極めて重要であることが示された。特に、VisDroneデータセットにおいて52.5%のmAPを達成し、既存の最先端手法を上回った。本手法は、航空画像における物体検出技術の大幅な進展をもたらすものであり、多様な実世界応用においてより正確かつ信頼性の高い結果の実現に貢献することが期待される。