2 个月前

HarDNet:一种低内存流量网络

Ping Chao; Chao-Yang Kao; Yu-Shan Ruan; Chien-Hsiang Huang; Youn-Long Lin
HarDNet:一种低内存流量网络
摘要

最先进的神经网络架构,如ResNet、MobileNet和DenseNet,在低MACs(乘积累加运算)和小模型尺寸的同类架构中实现了卓越的精度。然而,这些指标可能无法准确预测推理时间。我们建议,在访问中间特征图时产生的内存流量可能是影响推理延迟的主要因素,特别是在高分辨率视频的实时目标检测和语义分割等任务中。为此,我们提出了一种和谐密集连接网络(Harmonic Densely Connected Network),旨在同时降低MACs和内存流量,实现高效推理。与FC-DenseNet-103、DenseNet-264、ResNet-50、ResNet-152和SSD-VGG相比,该新网络分别实现了35%、36%、30%、32%和45%的推理时间减少。我们使用了包括Nvidia性能分析器和ARM Scale-Sim在内的工具来测量内存流量,并验证了推理延迟确实与内存流量消耗成正比,且所提出的网络具有较低的内存流量消耗。因此,我们在设计适用于边缘计算高分辨率应用的神经网络架构时,应考虑内存流量的影响。

HarDNet:一种低内存流量网络 | 最新论文 | HyperAI超神经