17 天前
SuperYOLO:基于超分辨率辅助的多模态遥感影像目标检测
Jiaqing Zhang, Jie Lei, Weiying Xie, Zhenman Fang, Yunsong Li, Qian Du

摘要
从遥感图像(RSI)中准确且及时地检测包含数十像素的多尺度小目标,仍然是一个具有挑战性的问题。现有大多数方法主要通过设计复杂的深度神经网络来学习目标与背景分离的强特征表示,但这往往带来沉重的计算负担。本文提出一种高效且准确的遥感图像小目标检测方法——SuperYOLO,该方法融合多模态数据,并结合辅助超分辨率(SR)学习,在多尺度小目标上实现高分辨率(HR)检测,同时兼顾检测精度与计算成本。首先,我们设计了一种对称紧凑的多模态融合(MF)模块,从多种数据源中提取补充信息,以增强遥感图像中小目标的检测能力。其次,我们引入一个简洁灵活的超分辨率分支,利用低分辨率(LR)输入学习高分辨率特征表示,从而有效区分小目标与庞大背景,进一步提升检测精度。此外,为避免增加推理阶段的计算开销,该SR分支在推理时被移除,由于网络输入保持为低分辨率,整体计算量显著降低。实验结果表明,在广泛使用的VEDAI遥感图像数据集上,SuperYOLO的mAP50达到75.09%,较当前最先进的大型模型(如YOLOv5l、YOLOv5x以及专为遥感设计的YOLOrs)高出超过10%。同时,SuperYOLO的参数量和GFLOPs分别仅为YOLOv5x的约1/18和1/3.8。与现有最先进模型相比,本模型在精度与速度之间展现出更优的权衡性能。相关代码将开源至:https://github.com/icey-zhang/SuperYOLO。