2 个月前
YOLOv10:实时端到端目标检测
Wang, Ao ; Chen, Hui ; Liu, Lihao ; Chen, Kai ; Lin, Zijia ; Han, Jungong ; Ding, Guiguang

摘要
近年来,YOLO系列模型因其在计算成本和检测性能之间实现了有效的平衡,已成为实时目标检测领域的主导范式。研究人员对YOLO模型的架构设计、优化目标、数据增强策略等方面进行了深入探索,取得了显著进展。然而,依赖非极大值抑制(Non-Maximum Suppression, NMS)进行后处理阻碍了YOLO模型的端到端部署,并对其推理延迟产生了不利影响。此外,YOLO模型中各个组件的设计缺乏全面和彻底的审查,导致了明显的计算冗余,限制了模型的能力。这不仅使得效率次优,还存在较大的性能提升潜力。在本研究中,我们旨在从后处理和模型架构两个方面进一步推进YOLO模型的性能-效率边界。为此,我们首先提出了用于无NMS训练的YOLO的一致双分配方法,该方法同时带来了具有竞争力的性能和低推理延迟。此外,我们引入了一种整体性的效率-准确性驱动的模型设计策略。我们从效率和准确性的角度全面优化了YOLO模型的各种组件,大大减少了计算开销并提升了模型能力。我们的努力成果是新一代的YOLO系列实时端到端目标检测模型——命名为YOLOv10。大量实验表明,无论在不同规模的模型上,YOLOv10均达到了最先进的性能和效率。例如,在COCO数据集上与RT-DETR-R18相似的AP值下,我们的YOLOv10-S速度提高了1.8倍,同时参数量和浮点运算次数(FLOPs)减少了2.8倍。与性能相当的YOLOv9-C相比,YOLOv10-B的延迟降低了46%,参数量减少了25%。