Conception Évolutif Multicritère de Réseaux de Neurones Convolutifs Profonds pour la Classification d'Images

Les premiers progrès dans les architectures de réseaux de neurones convolutifs (CNN) ont été principalement pilotés par l’expertise humaine et des processus de conception complexes. Récemment, la recherche d’architecture neuronique (Neural Architecture Search, NAS) a été proposée dans le but d’automatiser le processus de conception de réseaux et de générer des architectures adaptées aux tâches spécifiques. Bien que les approches existantes aient atteint des performances compétitives en classification d’images, elles ne sont pas bien adaptées aux problèmes où le budget de calcul est limité, pour deux raisons principales : (1) les architectures obtenues sont soit exclusivement optimisées pour la performance en classification, soit uniquement pour un seul scénario de déploiement ; (2) le processus de recherche nécessite, dans la majorité des cas, des ressources computationnelles considérables. Pour surmonter ces limitations, nous proposons un algorithme évolutionnaire pour la recherche d’architectures neuroniques sous plusieurs objectifs, tels que la performance en classification et le nombre d’opérations à virgule flottante (FLOPs). La méthode proposée remédie à la première faiblesse en générant un ensemble d’architectures permettant d’approximer l’ensemble du frontière de Pareto grâce à des opérations génétiques qui recombinent progressivement et modifient des composants architecturaux. Notre approche améliore l’efficacité computationnelle en réduisant soigneusement l’échelle des architectures durant la recherche, tout en renforçant les motifs fréquemment partagés par les architectures précédemment réussies grâce à un apprentissage bayésien. L’intégration de ces deux contributions principales permet une conception efficace d’architectures compétitives, qui surpassent, dans la plupart des cas, à la fois les architectures conçues manuellement et celles générées automatiquement sur des jeux de données classiques de classification d’images : CIFAR, ImageNet et radiographies thoraciques humaines. La flexibilité offerte par la possibilité d’obtenir simultanément plusieurs choix d’architectures adaptés à diverses contraintes de calcul distingue davantage notre approche des méthodes existantes dans la littérature. Le code est disponible à l’adresse suivante : https://github.com/mikelzc1990/nsganetv1