9 天前
基于多目标进化算法的深度卷积神经网络图像分类设计
Zhichao Lu, Ian Whalen, Yashesh Dhebar, Kalyanmoy Deb, Erik Goodman, Wolfgang Banzhaf, Vishnu Naresh Boddeti

摘要
卷积神经网络(CNN)架构的早期发展主要依赖于人工专业知识和复杂的结构设计流程。近年来,神经架构搜索(Neural Architecture Search, NAS)被提出,旨在自动化网络设计过程,并生成针对特定任务的优化架构。尽管现有方法在图像分类任务中已取得具有竞争力的性能,但在计算资源受限的问题场景下仍存在明显不足,主要原因有二:(1)现有方法获得的架构通常仅针对分类性能进行优化,或仅适配单一部署场景;(2)大多数方法的搜索过程需要消耗巨大的计算资源。为克服上述局限,本文提出一种基于进化算法的多目标神经架构搜索方法,同时优化分类性能与浮点运算量(FLOPs)等多重目标。本方法通过遗传操作逐步重组与修改网络结构组件,生成一组架构以近似完整的帕累托前沿(Pareto frontier),从而有效缓解第一项缺陷。同时,为提升搜索效率,我们在搜索过程中对架构进行精细化降维,并利用贝叶斯模型学习机制强化历史成功架构中普遍存在的结构模式。两项核心创新的融合,使得所设计的网络架构在基准图像分类数据集(包括CIFAR、ImageNet以及人类胸部X光数据集)上表现出卓越性能,不仅具备竞争力,且在多数情况下超越了人工设计与现有自动设计方法的架构表现。此外,本方法能够同时为不同计算资源约束提供多样化的架构选择,显著提升了设计灵活性,从而在现有文献方法中脱颖而出。相关代码已开源,地址为:https://github.com/mikelzc1990/nsganetv1。