HyperAIHyperAI

Command Palette

Search for a command to run...

DARTS: Differenzierbare Architektursuche

Hanxiao Liu* CMU [email protected] Karen Simonyan DeepMind [email protected] Yiming Yang CMU [email protected]

Zusammenfassung

Dieses Papier behandelt die Herausforderung der Skalierbarkeit von Architektursuchen durch eine differenzierbare Formulierung des Problems. Im Gegensatz zu herkömmlichen Ansätzen, bei denen Evolution oder Reinforcement Learning in einem diskreten und nicht-differenzierbaren Suchraum angewendet werden, basiert unsere Methode auf der kontinuierlichen Relaxation der Architekturrepräsentation. Dies ermöglicht eine effiziente Suche nach Architekturen unter Verwendung von Gradientenabstieg. Ausführliche Experimente auf CIFAR-10, ImageNet, Penn Treebank und WikiText-2 zeigen, dass unser Algorithmus hervorragend darin ist, hochleistungsfähige Faltungsarchitekturen für Bildklassifizierung und rekurrente Architekturen für Sprachmodelle zu entdecken, während er um Größenordnungen schneller als die besten nicht-differenzierbaren Techniken ist. Unsere Implementierung wurde öffentlich zugänglich gemacht, um weitere Forschungen zu effizienten Architektursuchalgorithmen zu fördern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
DARTS: Differenzierbare Architektursuche | Paper | HyperAI