3 个月前
FBNetV2:面向空间与通道维度的可微分神经架构搜索
Alvin Wan, Xiaoliang Dai, Peizhao Zhang, Zijian He, Yuandong Tian, Saining Xie, Bichen Wu, Matthew Yu, Tao Xu, Kan Chen, Peter Vajda, Joseph E. Gonzalez

摘要
可微分神经架构搜索(Differentiable Neural Architecture Search, DNAS)在设计当前最先进的高效神经网络方面已展现出显著成效。然而,基于DARTS的DNAS方法在搜索空间上相对有限,相较于其他搜索方法,其主要原因在于所有候选网络层都必须在内存中显式实例化。为突破这一瓶颈,我们提出一种内存与计算效率更高的DNAS变体——DMaskingNAS。该方法通过引入掩码机制,使搜索空间相比传统DNAS扩大高达$10^{14}$倍,从而支持对空间维度(如输入分辨率)和通道维度(如滤波器数量)的高效搜索,而这些维度在以往方法中因计算与内存开销过大而难以实现。DMaskingNAS采用特征图复用的掩码机制,使得随着搜索空间的扩展,内存占用和计算成本几乎保持不变。此外,我们引入有效的形状传播策略,以最大化每FLOP或每参数的精度。所搜索得到的FBNetV2模型在性能上超越此前所有已知架构,达到当前最优水平。相比MobileNetV3-Small,DMaskingNAS在搜索成本降低高达421倍的前提下,实现了0.9%更高的准确率,同时减少15%的FLOPs;与Efficient-B0相比,在相近准确率下减少20%的FLOPs。此外,FBNetV2在模型规模相当的情况下,相比MobileNetV3在准确率上提升2.6%。相关FBNetV2模型已开源,详见:https://github.com/facebookresearch/mobile-vision。