17 天前

高效的全局神经架构搜索

{Theocharis Theocharides, Christos Kyrkou, Shahid Siddiqui}
高效的全局神经架构搜索
摘要

神经架构搜索(Neural Architecture Search, NAS)在自动化神经网络设计方面展现出巨大潜力,能够为特定任务自动寻找最优网络结构。然而,由于需要评估大量候选架构以确定最优解,其训练成本极高,导致计算开销巨大。为加速NAS过程,近期研究通常将搜索范围限制在网络构建模块(即模块化搜索,modular search),而非对完整网络架构进行全局搜索(global search);同时,采用近似方法替代完整训练来评估候选架构性能,并使用梯度下降等连续优化方法,而非更适合离散结构优化的自然离散优化策略。然而,模块化搜索无法确定网络的宏观架构(如深度与宽度),导致搜索完成后仍需依赖人工试错进行调参,因而缺乏真正的自动化。针对这一问题,本文重新审视NAS范式,设计了一个可导航且具有丰富架构多样性的宏观-微观联合搜索空间(macro-micro search space)。此外,现有方法通常在整个搜索空间中采用统一的近似策略来评估候选架构,但不同网络在相同训练协议下可能难以公平比较。为此,我们提出一种面向架构的自适应近似方法,根据网络特性动态调整训练策略,实现更合理的性能评估。进一步地,我们提出一种高效的搜索策略,通过解耦宏观与微观网络设计过程,在精度与模型规模之间取得良好平衡,从而生成具有竞争力的网络架构。所提出的框架在EMNIST和KMNIST数据集上达到新的最先进性能,同时在CIFAR-10、CIFAR-100和FashionMNIST等主流数据集上也表现出极强的竞争力,且搜索速度比当前最快的全局搜索方法快2至4倍。最后,我们通过在真实计算机视觉任务中的应用验证了该框架的可迁移性,成功发现适用于人脸识别任务的高性能网络架构,展现了其在实际场景中的潜力。