17 天前

FemtoDet:面向能效与性能权衡的对象检测基准

Peng Tu, Xu Xie, Guo AI, Yuexiang Li, Yawen Huang, Yefeng Zheng
FemtoDet:面向能效与性能权衡的对象检测基准
摘要

面向边缘设备的高效目标检测器通常以参数量或推理速度等指标作为优化目标,但这些指标与检测器的实际能耗之间相关性较弱。然而,诸如始终在线的监控摄像头等视觉应用,对能耗具有极为严格的要求。为此,本文旨在通过从两个角度设计检测器,建立能耗与性能之间权衡关系的基准:1)我们对多种卷积神经网络(CNN)架构进行了系统性分析,识别出具有低能耗特性的结构设计,包括激活函数的选择、卷积算子的配置以及检测头(neck)中特征融合结构的优化。这些在以往研究中常被忽视的细节,实际上对检测器的能耗具有显著影响;2)为突破能耗与性能之间的权衡困境,我们基于所发现的低能耗组件,提出了一种以能耗为导向的均衡型检测器——FemtoDet。除新颖的架构设计外,我们进一步通过优化卷积结构与训练策略来提升FemtoDet的性能。具体而言,我们提出一种新的实例边界增强(Instance Boundary Enhancement, IBE)模块,用于优化卷积操作,缓解CNN在有限容量下难以兼顾多样化空间表征能力与检测任务之间的矛盾;同时,设计了一种递归式热重启(Recursive Warm-Restart, RecWR)训练策略,以应对主流数据增强带来的数据分布偏移问题,从而避免轻量化检测器陷入次优解。实验结果表明,FemtoDet仅需68.77k参数,即可在PASCAL VOC数据集上达到46.3 AP50的优异性能,并在高通骁龙865(Qualcomm Snapdragon 865)CPU平台上实现1.11 W功耗与64.47 FPS的推理速度。在COCO和TJU-DHD等多个数据集上的大量实验进一步验证了所提方法在多样化场景下的竞争力与鲁棒性。