基于模型交互的锚点修复用于航拍图像中的鲁棒目标检测

目标检测在计算机视觉领域取得了显著进展。然而,在外观退化条件下对小目标进行检测仍是极具挑战性的问题,尤其在航空遥感观测中尤为突出。为获取足够的正负样本以支持启发式训练,大多数目标检测器预先设定区域锚点(region anchors),通过计算与真实标注数据之间的交并比(Intersection-over-Union, IoU)来完成匹配。然而,这一机制常导致小目标被忽略或误标。本文提出一种高效的动态增强锚点(Dynamic Enhancement Anchor, DEA)网络,构建了一种新型训练样本生成机制。与现有先进方法不同,所提出的网络引入样本判别器(sample discriminator),实现基于锚点的检测单元与无锚点检测单元之间的交互式样本筛选,从而生成高质量的训练样本。此外,采用保守的基于锚点推理策略进行多任务联合训练,在提升模型性能的同时显著降低了计算复杂度。所提方法可同时支持定向(oriented)与水平(horizontal)目标检测任务。在两个具有挑战性的航空遥感基准数据集(DOTA 与 HRSC2016)上的大量实验表明,该方法在保持适中推理速度和较低训练计算开销的前提下,实现了当前最优的检测精度。在 DOTA 数据集上,基于 RoI-Transformer 基线的 DEA-Net 在定向目标检测任务中,即使使用较弱的主干网络(ResNet-101 而非 ResNet-152),仍比先进方法提升 0.40% 的平均精度均值(mean-Average-Precision, mAP);在水平目标检测任务中,使用相同主干网络时,mAP 提升达 3.08%。此外,基于 ReDet 基线的 DEA-Net 在 DOTA 上取得了 80.37% 的 mAP,达到当前最优水平。在 HRSC2016 数据集上,仅使用 3 个水平锚点,该方法即超越此前最优模型 1.1% 的 mAP,充分验证了其高效性与优越性。