HyperAIHyperAI
il y a 2 mois

NDDR-CNN : Fusion de caractéristiques couche par couche dans les CNN multi-tâches par réduction de dimensionnalité discriminative neuronale

Yuan Gao; Jiayi Ma; Mingbo Zhao; Wei Liu; Alan L. Yuille
NDDR-CNN : Fusion de caractéristiques couche par couche dans les CNN multi-tâches par réduction de dimensionnalité discriminative neuronale
Résumé

Dans cet article, nous proposons une nouvelle structure de Réseau Neuronal Convolutif (CNN) pour l'apprentissage multitâche général (MTL), qui permet la fusion automatique des caractéristiques à chaque couche provenant de différentes tâches. Cela contraste avec les structures de CNN MTL les plus largement utilisées, qui partagent empiriquement ou heuristiquement des caractéristiques sur certaines couches spécifiques (par exemple, partager toutes les caractéristiques sauf la dernière couche convolutive). Le schéma de fusion de caractéristiques par couche proposé est formulé en combinant des composants existants de CNN d'une manière nouvelle, avec une interprétation mathématique claire en tant que réduction discriminante de dimensionnalité, ce qui est appelé Réduction Discriminante de Dimensionnalité Neuronale (NDDR). Plus précisément, nous concaténons d'abord les caractéristiques ayant la même résolution spatiale provenant de différentes tâches selon leur dimension canal. Ensuite, nous montrons que la réduction discriminante de dimensionnalité peut être réalisée par une convolution 1x1, une normalisation par lots et un décroissance du poids dans un seul CNN. L'utilisation de composants existants de CNN garantit l'entraînement end-to-end et l'extensibilité de la couche NDDR proposée à diverses architectures CNN avancées d'une manière « plug-and-play ». Une analyse détaillée d'ablation montre que la couche NDDR proposée est facile à entraîner et également robuste aux différents hyperparamètres. Des expériences menées sur différents ensembles de tâches avec diverses architectures de réseau de base démontrent les performances prometteuses et la généralisabilité souhaitable de notre méthode proposée. Le code de notre article est disponible à l'adresse suivante : https://github.com/ethanygao/NDDR-CNN.

NDDR-CNN : Fusion de caractéristiques couche par couche dans les CNN multi-tâches par réduction de dimensionnalité discriminative neuronale | Articles de recherche | HyperAI