HyperAIHyperAI
il y a un mois

Res2Net : Une Nouvelle Architecture de Tronc Multi-échelle

Shang-Hua Gao; Ming-Ming Cheng; Kai Zhao; Xin-Yu Zhang; Ming-Hsuan Yang; Philip Torr
Res2Net : Une Nouvelle Architecture de Tronc Multi-échelle
Résumé

La représentation de caractéristiques à plusieurs échelles est d'une grande importance pour de nombreuses tâches en vision par ordinateur. Les récentes avancées dans les réseaux neuronaux convolutifs (CNNs) démontrent continuellement une capacité accrue à représenter des caractéristiques multi-échelles, ce qui se traduit par des gains de performance constants sur un large éventail d'applications. Cependant, la plupart des méthodes existantes représentent les caractéristiques multi-échelles de manière couche par couche. Dans cet article, nous proposons un nouveau bloc de construction pour les CNNs, appelé Res2Net, en construisant des connexions hiérarchiques similaires aux résiduelles au sein d'un seul bloc résiduel. Le Res2Net représente les caractéristiques multi-échelles à un niveau granulaire et augmente la portée des champs récepteurs pour chaque couche du réseau. Le bloc Res2Net proposé peut être intégré dans les modèles CNNs de base les plus performants actuellement disponibles, tels que ResNet, ResNeXt et DLA. Nous évaluons le bloc Res2Net sur tous ces modèles et démontrons des gains de performance constants par rapport aux modèles de référence sur des jeux de données largement utilisés, tels que CIFAR-100 et ImageNet. Des études supplémentaires d'ablation et des résultats expérimentaux sur des tâches emblématiques en vision par ordinateur, comme la détection d'objets, la cartographie d'activation de classe et la détection d'objets saillants, confirment davantage la supériorité du Res2Net par rapport aux méthodes de référence les plus avancées. Le code source et les modèles entraînés sont disponibles sur https://mmcheng.net/res2net/.

Res2Net : Une Nouvelle Architecture de Tronc Multi-échelle | Articles de recherche récents | HyperAI