HyperAIHyperAI
il y a 2 mois

Recherche d'architectures multi-échelles efficaces pour la prédiction d'images denses

Liang-Chieh Chen; Maxwell D. Collins; Yukun Zhu; George Papandreou; Barret Zoph; Florian Schroff; Hartwig Adam; Jonathon Shlens
Recherche d'architectures multi-échelles efficaces pour la prédiction d'images denses
Résumé

La conception d'architectures de réseaux neuronaux est un élément crucial pour atteindre des performances de pointe avec les systèmes d'apprentissage automatique dans une large gamme de tâches. De nombreux travaux ont été consacrés à la création automatique d'architectures grâce à une construction astucieuse d'un espace de recherche associée à des algorithmes d'apprentissage simples. Les progrès récents ont montré que ces méthodes de méta-apprentissage peuvent surpasser les architectures inventées par l'homme sur des tâches de classification d'images. Une question ouverte est le degré auquel ces méthodes peuvent être généralisées à de nouveaux domaines. Dans ce travail, nous explorons la construction de techniques de méta-apprentissage pour la prédiction dense d'images, en nous concentrant sur les tâches d'analyse de scènes, de segmentation des parties du corps humain et de segmentation sémantique d'images. La création d'espaces de recherche viables dans ce domaine est difficile en raison de la représentation multi-échelle des informations visuelles et de la nécessité de traiter des images haute résolution. Sur la base d'une revue des techniques en prédiction dense d'images, nous construisons un espace de recherche récursif et démontrons qu'avec une recherche aléatoire efficace, nous pouvons identifier des architectures qui surpassent les architectures inventées par l'homme et atteignent des performances de pointe sur trois tâches de prédiction dense, notamment 82,7 % sur Cityscapes (analyse des scènes urbaines), 71,3 % sur PASCAL-Person-Part (segmentation des parties du corps humain) et 87,9 % sur PASCAL VOC 2012 (segmentation sémantique d'images). De plus, l'architecture résultante est plus efficace sur le plan computationnel, nécessitant moitié moins de paramètres et moitié moins coûteuse en termes de calcul que les systèmes précédents considérés comme étant à l'état de l'art.

Recherche d'architectures multi-échelles efficaces pour la prédiction d'images denses | Articles de recherche récents | HyperAI