HyperAIHyperAI
il y a 11 jours

DeepGCNs : Faire atteindre aux GCNs une profondeur comparable à celle des CNNs

Guohao Li, Matthias Müller, Guocheng Qian, Itzel C. Delgadillo, Abdulellah Abualshour, Ali Thabet, Bernard Ghanem
DeepGCNs : Faire atteindre aux GCNs une profondeur comparable à celle des CNNs
Résumé

Les réseaux de neurones convolutifs (CNN) se sont révélés extrêmement efficaces pour résoudre une grande variété de tâches en vision par ordinateur, telles que la classification d’objets, la détection d’objets, la segmentation sémantique ou encore la compréhension des activités, pour n’en citer que quelques-unes. Un facteur clé de leur succès réside dans la capacité à entraîner des réseaux très profonds. Malgré leurs performances remarquables dans de nombreuses applications, les CNN ne s’adaptent pas bien aux données non euclidiennes, qui sont courantes dans de nombreux contextes réels. Les réseaux de neurones graphes (GCN) offrent une alternative permettant d’accepter des données non euclidiennes en entrée d’un réseau de neurones. Bien que les GCN aient déjà atteint des résultats encourageants, leur architecture reste actuellement limitée à un nombre relativement faible de couches, principalement en raison du phénomène de disparition des gradients lors de l’entraînement. Ce travail adapte des concepts issus des CNN, tels que les connexions résiduelles ou densément connectées, ainsi que les convolutions dilatées, afin de permettre l’entraînement efficace de GCN très profonds. Nous démontrons expérimentalement les avantages de l’utilisation de GCN profonds (jusqu’à 112 couches) sur divers jeux de données et tâches. Plus précisément, nous obtenons des performances très prometteuses dans la segmentation de parties et la segmentation sémantique sur des nuages de points, ainsi que dans la classification des nœuds pour les fonctions protéiques sur des graphes d’interactions protéine-protéine (PPI) biologiques. Nous pensons que les insights apportés par ce travail ouvriront de nouvelles voies pour la recherche future sur les GCN et leur application à des tâches non explorées dans cette étude. Le code source de ce travail est disponible à l’adresse suivante : https://github.com/lightaime/deep_gcns_torch pour une implémentation PyTorch, et https://github.com/lightaime/deep_gcns pour une implémentation TensorFlow.

DeepGCNs : Faire atteindre aux GCNs une profondeur comparable à celle des CNNs | Articles de recherche récents | HyperAI