2 个月前

SCAResNet:一种优化用于输电塔和配电塔小微目标检测的ResNet变体

Li, Weile ; Shi, Muqing ; Hong, Zhonghua
SCAResNet:一种优化用于输电塔和配电塔小微目标检测的ResNet变体
摘要

传统的基于深度学习的目标检测网络在数据预处理阶段通常会对图像进行缩放,以实现特征图的统一尺寸和比例。缩放操作是为了便于模型传播和全连接分类。然而,缩放不可避免地会导致目标变形和图像中有价值的信息丢失。这一缺点对于线性形状且像素较少的小目标(如配电塔)尤为明显。为了解决这一问题,我们提出放弃图像缩放操作,转而引入位置编码多头交叉注意力(Positional-encoding Multi-head Criss-Cross Attention)。这使得模型能够捕捉上下文信息并从多个表示子空间中学习,从而有效丰富配电塔的语义信息。此外,我们通过重塑三个池化特征图生成一个新的统一特征图,同时减少了计算负担,进一步增强了空间金字塔池化(Spatial Pyramid Pooling)。这种方法允许不同尺寸和比例的图像生成具有统一维度的特征图,并可用于特征图传播。我们的SCAResNet将这些改进集成到骨干网络ResNet中。我们使用杜克大学提供的电力传输与分配基础设施影像数据集对SCAResNet进行了评估。在没有任何额外技巧的情况下,我们采用了基于高斯感受野标签分配的各种目标检测模型作为基线模型。当将SCAResNet整合到基线模型中时,我们在mAP指标上实现了2.1%的提升。这表明我们的SCAResNet在检测输电和配电塔方面具有优势,并且在小目标检测中也展现出其价值。源代码可在https://github.com/LisavilaLee/SCAResNet_mmdet 获取。

SCAResNet:一种优化用于输电塔和配电塔小微目标检测的ResNet变体 | 最新论文 | HyperAI超神经