HyperAIHyperAI

Command Palette

Search for a command to run...

DARTS: 微分可能なアーキテクチャ探索

Hanxiao Liu* CMU [email protected] Karen Simonyan DeepMind [email protected] Yiming Yang CMU [email protected]

概要

本論文では、アーキテクチャ検索のスケーラビリティの課題に取り組み、タスクを微分可能な形で定式化することによって解決を試みています。従来の手法が離散的かつ非微分可能な探索空間に対して進化アルゴリズムや強化学習を適用するのとは異なり、当方法はアーキテクチャ表現の連続的な緩和に基づいており、勾配降下法を使用して効率的にアー�キテクチャを探索することが可能となります。CIFAR-10、ImageNet、Penn TreebankおよびWikiText-2における広範な実験結果から、当アルゴリズムは画像分類用の高性能な畳み込みアーキテクチャと言語モデル用の再帰型アーキテクチャの発見において優れた性能を示し、最先端の非微分技術よりも桁違いに高速であることが確認されました。また、効率的なアーキテクチャ検索アルゴリズムに関するさらなる研究を促進するために、当実装は公開されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています