8 天前

T-YOLO:基于YOLO与多尺度卷积神经网络的微型车辆检测

{Domenec Puig, Miguel Ángel García, Hatem RashwanHatem Rashwan, Daniel Padilla Carrasco}
摘要

为解决智慧城市各类应用场景中的实际问题,如停车位占用检测,通常需要对深度神经网络进行精细调优。对于大型停车场而言,理想方案是采用安装在高处的俯视平面摄像头,仅通过单一摄像头即可实现对整个停车场或大范围停车区域的全面监控。当前主流的目标检测模型(如YOLO系列)能够在实时速度下实现较高的检测精度。然而,当使用与通用数据集(如COCO、ImageNet)不同的自定义数据时,模型性能存在较大的优化空间。本文提出一种基于YOLO-v5架构的改进型轻量化深度目标检测模型。该模型具备检测大、中、小乃至超小目标的能力。具体而言,我们引入了一种多尺度机制,以在不同尺度下学习深层判别性特征表示,并能自动识别场景中最具检测优势的尺度(在本研究中即车辆目标)。所提出的多尺度模块在保持高性能的同时,显著减少了可训练参数数量,相较于原始YOLO-v5架构具有更高的参数效率。实验结果表明,模型精度得到显著提升。事实上,实验数据显示,模型参数量从YOLO-v5-S版本的728万略微降低至726万,降幅虽小但体现了参数优化的成效。此外,检测速度方面,本模型在保持高精度的同时,推理速度达到30帧每秒(fps),优于YOLO-v5-L/X等大型模型。尤其值得注意的是,对于超小车辆目标的检测性能相较YOLO-v5-X版本提升了33%,展现出显著的性能优势。

T-YOLO:基于YOLO与多尺度卷积神经网络的微型车辆检测 | 最新论文 | HyperAI超神经