11 天前

YOLOv6:面向工业应用的单阶段目标检测框架

Chuyi Li, Lulu Li, Hongliang Jiang, Kaiheng Weng, Yifei Geng, Liang Li, Zaidan Ke, Qingyuan Li, Meng Cheng, Weiqiang Nie, Yiduo Li, Bo Zhang, Yufei Liang, Linyuan Zhou, Xiaoming Xu, Xiangxiang Chu, Xiaoming Wei, Xiaolin Wei
YOLOv6:面向工业应用的单阶段目标检测框架
摘要

多年来,YOLO系列已成为高效目标检测领域公认的行业标准。YOLO社区蓬勃发展,极大地拓展了其在各类硬件平台和丰富应用场景中的实用性。在本技术报告中,我们致力于将YOLO系列的性能推向新高度,以坚定的产业应用导向持续前行。针对真实场景中对速度与精度多样化的需求,我们全面调研了来自工业界与学术界的最新目标检测进展。具体而言,我们深入吸收了近期在网络结构设计、训练策略、测试技术、量化方法及优化手段等方面的创新思想。在此基础上,结合我们的研究思考与工程实践,构建了一套覆盖多种尺度、可直接部署的网络模型,以满足多样化的实际应用需求。在YOLO原作者的大力支持与授权下,我们将其命名为YOLOv6。我们诚挚欢迎广大用户与贡献者共同参与,持续推动该模型的优化与完善。性能方面,YOLOv6-N在NVIDIA Tesla T4 GPU上实现了1234 FPS的吞吐量,同时在COCO数据集上达到35.9%的AP(平均精度);YOLOv6-S在495 FPS的推理速度下取得43.5%的AP,显著优于同规模主流检测器(如YOLOv5-S、YOLOX-S和PPYOLOE-S)。此外,YOLOv6-S的量化版本更实现了43.3%的AP,达到869 FPS的推理速度,刷新了同类模型的性能纪录。在更大规模的YOLOv6-M和YOLOv6-L上,我们也取得了优于同类检测器的精度表现(分别为49.5%和52.3%),同时保持相近的推理速度。我们通过系统性实验对各组件的有效性进行了严谨验证。相关代码已开源,欢迎访问:https://github.com/meituan/YOLOv6。

YOLOv6:面向工业应用的单阶段目标检测框架 | 最新论文 | HyperAI超神经