HyperAIHyperAI
il y a 11 jours

CASSOD-Net : Structures en cascade et séparables à convolution dilatée pour les systèmes et applications de vision embarqués

Tse-Wei Chen, Deyu Wang, Wei Tao, Dongchao Wen, Lingxiao Yin, Tadayuki Ito, Kinya Osa, Masami Kato
CASSOD-Net : Structures en cascade et séparables à convolution dilatée pour les systèmes et applications de vision embarqués
Résumé

Le champ de vue (FOV) des réseaux de neurones convolutionnels est étroitement lié à la précision de l'inférence. Les convolution dilatées sont reconnues comme une solution efficace pour les tâches nécessitant un large champ de vue. Toutefois, sur des architectures matérielles générales ou spécialisées, le traitement des convolution dilatées demande généralement plus de temps que celui des convolution standard. Dans cet article, nous proposons un module de réseau, appelé convolution en structure cascade et séparable dilatée (CASSOD), ainsi qu’un système matériel spécifique pour traiter efficacement les réseaux CASSOD. Un réseau CASSOD-Net intègre plusieurs filtres dilatés $2 \times 2$ en cascade, pouvant remplacer les filtres dilatés traditionnels $3 \times 3$ sans compromettre la précision de l’inférence. Deux applications exemplaires — la détection de visages et la segmentation d’images — ont été testées avec des convolution dilatées classiques et les modules CASSOD proposés. Le nouveau réseau pour la détection de visages atteint une précision supérieure à celle des travaux antérieurs, tout en utilisant uniquement 47 % des poids des filtres dans les couches de convolution dilatée du module contextuel. En outre, le système matériel proposé accélère les calculs des convolution dilatées, étant 2,78 fois plus rapide que les systèmes matériels traditionnels pour une taille de filtre $3 \times 3$.

CASSOD-Net : Structures en cascade et séparables à convolution dilatée pour les systèmes et applications de vision embarqués | Articles de recherche récents | HyperAI