HyperAIHyperAI

Command Palette

Search for a command to run...

DARTS:可微分架构搜索

Hanxiao Liu* CMU [email protected] Karen Simonyan DeepMind [email protected] Yiming Yang CMU [email protected]

摘要

本文通过将架构搜索任务公式化为可微分形式,解决了其扩展性挑战。与传统方法在离散且不可微分的搜索空间中应用进化算法或强化学习不同,我们的方法基于对架构表示的连续松弛,允许使用梯度下降高效地搜索架构。在CIFAR-10、ImageNet、Penn Treebank和WikiText-2上进行的大量实验表明,我们的算法在图像分类的高性能卷积架构和语言建模的递归架构发现方面表现出色,同时比最先进的非可微分技术快几个数量级。我们已将实现公开发布,以促进对高效架构搜索算法的进一步研究。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供