HyperAIHyperAI
il y a 20 jours

CATCH : Apprentissage par renforcement méta basé sur le contexte pour une recherche d'architecture transférable

Xin Chen, Yawen Duan, Zewei Chen, Hang Xu, Zihao Chen, Xiaodan Liang, Tong Zhang, Zhenguo Li
CATCH : Apprentissage par renforcement méta basé sur le contexte pour une recherche d'architecture transférable
Résumé

La recherche d'architecture neuronale (Neural Architecture Search, NAS) a connu de nombreux progrès récents. Malgré ces avancées remarquables, de nombreux algorithmes sont restreints à des espaces de recherche spécifiques et manquent de mécanismes efficaces pour réutiliser les connaissances lorsqu’ils sont confrontés à plusieurs tâches. Ces limites entravent leur applicabilité et motivent la proposition de CATCH, un nouvel algorithme basé sur l’apprentissage métadécisionnel (meta-RL) à contexte pour la recherche d’architecture transférable. La combinaison de l’apprentissage métadécisionnel et de l’apprentissage par renforcement permet à CATCH de s’adapter efficacement à de nouvelles tâches tout en étant indépendant de l’espace de recherche. CATCH utilise un encodeur probabiliste pour représenter les propriétés des tâches sous forme de variables latentes contextuelles, qui guident ensuite le contrôleur de CATCH afin de rapidement « capter » les architectures performantes. Ces contextes aident également l’évaluateur de réseau à éliminer les candidats inférieurs et à accélérer l’apprentissage. Des expériences étendues démontrent l’universalité et l’efficacité de la recherche de CATCH par rapport à de nombreux algorithmes largement reconnus. CATCH est également capable de traiter des recherches d’architecture inter-domaines, puisqu’il identifie des architectures compétitives sur des jeux de données variés tels qu’ImageNet, COCO et Cityscapes. À notre connaissance, ce travail constitue la première proposition d’une solution efficace de NAS transférable tout en préservant une robustesse dans diverses configurations.

CATCH : Apprentissage par renforcement méta basé sur le contexte pour une recherche d'architecture transférable | Articles de recherche | HyperAI