HyperAIHyperAI
vor 20 Tagen

CATCH: kontextbasierte meta-verstärkendes Lernen für übertragbaren Architektursuchprozess

Xin Chen, Yawen Duan, Zewei Chen, Hang Xu, Zihao Chen, Xiaodan Liang, Tong Zhang, Zhenguo Li
CATCH: kontextbasierte meta-verstärkendes Lernen für übertragbaren Architektursuchprozess
Abstract

Neural Architecture Search (NAS) hat in den letzten Jahren zahlreiche Durchbrüche erzielt. Trotz seiner bemerkenswerten Fortschritte sind viele Algorithmen auf bestimmte Suchräume beschränkt und verfügen zudem über ineffiziente Mechanismen, um Wissen bei der Bewältigung mehrerer Aufgaben zu reutilisieren. Diese Herausforderungen erschweren ihre Anwendbarkeit und motivieren uns, CATCH vorzustellen – einen neuartigen, kontextbasierten Meta-Reinforcement-Learning-(RL)-Algorithmus für übertragbare Architektursuche. Die Kombination von Meta-Lernen und RL ermöglicht es CATCH, sich effizient neuen Aufgaben anzupassen, ohne von spezifischen Suchräumen abhängig zu sein. CATCH nutzt einen probabilistischen Encoder, um Aufgabenmerkmale in latente Kontextvariablen zu kodieren, die anschließend den Controller von CATCH leiten, um schnell hochperformante Netzwerke „zu erfassen“. Diese Kontexte unterstützen zudem einen Netzwerkevaluator dabei, schlechte Kandidaten zu filtern und das Lernen zu beschleunigen. Umfangreiche Experimente belegen die Universalität und Sucheffizienz von CATCH im Vergleich zu zahlreichen anderen etablierten Algorithmen. Zudem ist CATCH in der Lage, Architektursuche über Domänen hinweg durchzuführen, da auf ImageNet, COCO und Cityscapes konkurrenzfähige Netzwerke identifiziert werden konnten. Dies ist, soweit uns bekannt, die erste Arbeit, die eine effiziente, übertragbare NAS-Lösung vorschlägt, die gleichzeitig robust in unterschiedlichen Szenarien bleibt.