17 天前
从模糊到清晰:基于超分辨率的YOLOv5航空目标检测
Ragib Amin Nihal, Benjamin Yen, Katsutoshi Itoyama, Kazuhiro Nakadai

摘要
随着无人机和卫星技术的广泛应用,对航拍图像中精准目标检测的需求急剧上升。传统目标检测模型通常在以大型目标为主的训练数据集上进行训练,难以在小目标密集分布的航拍场景中实现最优性能。为应对这一挑战,本文提出一种创新方法,将超分辨率技术与改进的轻量级YOLOv5架构相结合。我们采用VisDrone-2023、SeaDroneSee、VEDAI以及NWPU VHR-10等多个公开数据集,对所提模型的性能进行全面评估。所提出的超分辨率YOLOv5架构引入了Transformer编码器模块,使模型能够有效捕捉全局上下文信息,显著提升在高密度、遮挡严重等复杂场景下的检测能力。该轻量级模型不仅在检测精度上表现优异,同时具备高效的资源利用特性,非常适合实时应用场景。实验结果表明,该方法在小目标及密集目标检测任务中展现出显著优势,充分凸显了数据集选择与模型架构适配对该任务的重要性。特别地,该方法在VisDrone数据集上实现了52.5%的mAP,超越了现有顶尖方法。本研究为航拍图像中的目标检测技术提供了重要进展,有望在多种实际应用中实现更精准、更可靠的检测效果。