17 天前

DAMO-YOLO:实时目标检测设计报告

Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
DAMO-YOLO:实时目标检测设计报告
摘要

在本报告中,我们提出了一种快速且高精度的目标检测方法——DAMO-YOLO,其性能超越了当前最先进的YOLO系列模型。DAMO-YOLO在YOLO基础上引入了一系列新技术,包括神经架构搜索(Neural Architecture Search, NAS)、高效的重参数化广义特征金字塔网络(Reparameterized Generalized-FPN, RepGFPN)、采用对齐OTA标签分配机制的轻量化检测头,以及知识蒸馏增强策略。特别地,我们采用基于最大熵原则引导的MAE-NAS方法,在低延迟与高性能双重约束下搜索检测骨干网络,成功设计出具有空间金字塔池化(Spatial Pyramid Pooling)和聚焦模块(Focus)结构的ResNet/CSP类网络架构。在颈部(neck)与头部(head)的设计上,遵循“大颈部、小头部”的设计原则。我们引入了融合加速机制的广义特征金字塔网络(Generalized-FPN)构建检测器颈部,并通过高效层聚合网络(Efficient Layer Aggregation Networks, ELAN)与重参数化技术对CSPNet进行升级。进一步地,我们系统研究了检测头大小对检测性能的影响,发现仅配备单一任务投影层的重型颈部结构能够带来更优的检测效果。此外,我们提出了AlignedOTA方法,有效解决了传统标签分配中存在的标签错位问题。同时,引入了一种知识蒸馏方案,进一步提升模型性能至更高水平。基于上述创新技术,我们构建了一套覆盖多种尺度的模型系列,以满足不同应用场景的需求。针对通用工业场景,我们提出了DAMO-YOLO-T/S/M/L系列模型。在T4 GPU上,其推理延迟分别为2.78/3.83/5.62/7.95毫秒,对应在COCO数据集上的mAP指标达到43.6/47.7/50.2/51.9。针对计算资源受限的边缘设备,我们还推出了DAMO-YOLO-Ns/Nm/Nl轻量化模型系列。在X86 CPU上,其延迟分别为4.08/5.05/6.69毫秒,对应COCO数据集上的mAP分别为32.3/38.2/40.5。实验结果表明,我们提出的通用型与轻量化模型在各自的应用场景中均显著优于其他YOLO系列模型,展现出卓越的性能与实用性。

DAMO-YOLO:实时目标检测设计报告 | 最新论文 | HyperAI超神经