HyperAIHyperAI

Command Palette

Search for a command to run...

DrNAS:ディリクレニューラルアーキテクチャサーチ

Xiangning Chen Ruochen Wang Minhao Cheng Xiaocheng Tang Cho-Jui Hsieh

概要

本稿では、アーキテクチャ探索を分布学習問題として定式化することで、新たな微分可能アーキテクチャ探索(differentiable NAS)手法を提案する。我々は、連続的に緩和されたアーキテクチャ混合重みを確率変数とみなす。この確率変数はディリクレ分布(Dirichlet distribution)によってモデル化される。近年開発されたパスワイズ微分(pathwise derivatives)を用いることで、ディリクレ分布のパラメータは勾配ベースの最適化手法を用いて、エンドツーエンドのフレームワークで容易に最適化可能となる。この定式化により、一般化性能が向上するとともに、探索空間における自然な探索を促進する確率的性質が導かれる。さらに、微分可能NASにおける大きなメモリ消費を軽減するため、大規模なタスク上で直接探索が可能な、シンプルかつ効果的なプログレッシブ学習スキームを提案する。これにより、探索フェーズと評価フェーズの間に生じるギャップを解消する。広範な実験により、本手法の有効性が実証された。具体的には、モバイル設定下でCIFAR-10において2.46%のテスト誤差、ImageNetでは23.7%のテスト誤差を達成した。また、NAS-Bench-201においては、3つのデータセットすべてで最先端の性能を達成し、ニューラルアーキテクチャ探索アルゴリズムの効果的な設計に関する知見を提供した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています