HyperAIHyperAI
il y a 2 mois

Recherche automatique basée sur un modèle d'architectures compactes pour la segmentation sémantique

Nekrasov, Vladimir ; Shen, Chunhua ; Reid, Ian
Recherche automatique basée sur un modèle d'architectures compactes pour la segmentation sémantique
Résumé

La recherche automatique d'architectures neuronales pour diverses tâches de vision et de traitement du langage naturel devient un outil de premier plan, car elle permet de découvrir des structures à haute performance sur n'importe quel ensemble de données d'intérêt. Néanmoins, dans des domaines plus complexes, comme la classification dense par pixel, les approches actuelles sont limitées dans leur portée — en raison de leur forte dépendance aux classifieurs d'images existants, elles tendent à ne rechercher qu'un petit nombre de couches supplémentaires, les architectures découvertes contenant toujours un grand nombre de paramètres. En revanche, dans ce travail, nous proposons une nouvelle solution capable de trouver des architectures de segmentation légères et précises à partir de seulement quelques blocs d'un réseau pré-entraîné pour la classification. À cette fin, nous développons progressivement une méthodologie qui repose sur des modèles d'ensembles d'opérations, prédit quel modèle et combien de fois il devrait être appliqué à chaque étape, tout en générant la structure de connectivité et les facteurs de réduction d'échelle. Toutes ces décisions sont prises par un réseau neuronal récurrent qui est récompensé en fonction du score de l'architecture émise sur l'ensemble de validation et formé à l'aide d'apprentissage par renforcement. Une architecture découverte atteint 63,2% d'IoU moyen sur CamVid et 67,8% sur CityScapes avec seulement 270K paramètres. Les modèles pré-entraînés et le code de recherche sont disponibles à l'adresse suivante : https://github.com/DrSleep/nas-segm-pytorch.