6 个月前

摘要

神经架构搜索（Neural Architecture Search, NAS）旨在自动化架构搜索过程，取代传统的人工设计方式。尽管近年来的NAS方法已能在数日内完成搜索，但针对每个候选架构仍需进行长时间训练，以获取其参数并准确评估性能。为此，近期提出的一次性NAS（one-shot NAS）方法通过在候选架构间共享参数，大幅压缩了耗时的训练过程：候选架构的参数可直接从共享参数中提取，而无需从头训练。然而，这类方法在评估前无法预判各候选架构的性能优劣，因此通常采用随机采样方式选择待评估候选，最终仅将表现最好的单一候选视为最优结果。本文提出一种自评估模板网络（Self-Evaluated Template Network, SETN），旨在提升待评估候选架构的质量，从而更有可能覆盖具有竞争力的架构。SETN由两个核心组件构成：（1）评估器（evaluator），其学习预测每个独立架构具有较低验证损失的概率，从而实现基于评估器结果的有选择性采样；（2）模板网络（template network），在所有候选架构之间共享参数，以分摊生成候选架构的训练开销。实验结果表明，SETN所发现的架构在CIFAR与ImageNet基准测试上均达到了当前最优性能，且计算成本与现有方法相当。相关代码已公开于GitHub：https://github.com/D-X-Y/AutoDL-Projects。

源 PDF