6 个月前

计算机视觉

计算机视觉

Xiangxiang Chu Tianbao Zhou Bo Zhang Jixiang Li

摘要

可微分架构搜索（Differentiable Architecture Search, DARTS）如今已成为一种广泛应用的权重共享神经架构搜索方法。然而，该方法因不可避免地聚集跳跃连接（skip connections）而面临众所周知的性能坍塌问题。本文首次揭示，其根本原因在于在互斥竞争中存在不公平的优势。通过实验我们发现，只要打破以下两个条件中的任意一个，性能坍塌现象便会消失。基于此，我们提出一种名为 Fair DARTS 的新方法，将原有的互斥竞争关系松弛为协作关系。具体而言，我们使每个操作的架构权重相互独立，不再依赖于其他操作。然而，仍存在一个关键问题——离散化偏差。为此，我们引入一种零一损失（zero-one loss），促使架构权重趋向于 0 或 1，从而近似实现期望的多热（multi-hot）解。我们在两个主流搜索空间上进行了实验，在 CIFAR-10 和 ImageNet 上均取得了新的最先进（state-of-the-art）性能。相关代码已开源，地址为：https://github.com/xiaomi-automl/fairdarts。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

计算机视觉

Xiangxiang Chu Tianbao Zhou Bo Zhang Jixiang Li

摘要

可微分架构搜索（Differentiable Architecture Search, DARTS）如今已成为一种广泛应用的权重共享神经架构搜索方法。然而，该方法因不可避免地聚集跳跃连接（skip connections）而面临众所周知的性能坍塌问题。本文首次揭示，其根本原因在于在互斥竞争中存在不公平的优势。通过实验我们发现，只要打破以下两个条件中的任意一个，性能坍塌现象便会消失。基于此，我们提出一种名为 Fair DARTS 的新方法，将原有的互斥竞争关系松弛为协作关系。具体而言，我们使每个操作的架构权重相互独立，不再依赖于其他操作。然而，仍存在一个关键问题——离散化偏差。为此，我们引入一种零一损失（zero-one loss），促使架构权重趋向于 0 或 1，从而近似实现期望的多热（multi-hot）解。我们在两个主流搜索空间上进行了实验，在 CIFAR-10 和 ImageNet 上均取得了新的最先进（state-of-the-art）性能。相关代码已开源，地址为：https://github.com/xiaomi-automl/fairdarts。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供