11 天前
VDDT:基于可变形Transformer的船舶检测性能提升
{Lefan Wang, Zhihui Chen, Ruixin Zheng, Jinhe Su, Yiling Liu, Siyu Chen}
摘要
船舶检测在目标检测领域受到广泛关注,近期提出的DETR模型成功实现了真正的端到端目标检测,并展现出良好的性能。然而,DETR对小目标的检测敏感度较低,导致其在船舶检测任务中表现不尽如人意。本文以可变形DETR(Deformable DETR)作为基线模型,并在此基础上进行改进。首先,我们在目标查询(object queries)中引入参考点信息,以增强目标查询所学习特征的丰富性,从而提升检测器的性能;其次,采用多层感知机(multi-layer perceptron)替代解码器中的多头自注意力机制,以降低解码器的计算开销。此外,本文收集了85段标注视频,共包含4563张图像,并基于这些图像构建了一个专用的船舶检测数据集。在该船舶数据集上的实验结果表明,所提出的VDDT模型相较于基线模型具有更优的检测性能。