11 天前
RNNPool:面向内存受限推理的高效非线性池化
Oindrila Saha, Aditya Kusupati, Harsha Vardhan Simhadri, Manik Varma, Prateek Jain

摘要
专为计算机视觉任务设计的标准卷积神经网络(CNN)通常具有较大的中间激活图,这需要大量的工作内存,因此难以部署在资源受限的边缘设备上进行推理。虽然通过池化或步幅卷积对图像进行激进下采样可在一定程度上缓解内存压力,但标准池化算子对特征图的粗粒度聚合会导致显著的精度下降。本文提出一种基于循环神经网络(RNN)的新颖池化算子——RNNPool,能够高效地对图像大块区域进行特征聚合,并实现快速下采样。实证评估表明,将RNNPool层应用于图像分类、人脸检测等标准视觉任务时,可有效替代MobileNet、DenseNet等多种架构中的多个传统模块,在显著降低推理过程中的计算复杂度和峰值内存占用的同时,仍能保持与原有模型相当的精度水平。我们将RNNPool与标准S3FD架构结合,构建了一种面向极小规模边缘设备的人脸检测方法,在仅配备不足256 KB RAM的ARM Cortex-M4类微控制器上实现了当前最优的平均精度(MAP)。相关代码已开源,地址为:https://github.com/Microsoft/EdgeML。