HarDNet : Un réseau à faible trafic mémoire

Les architectures de réseaux neuronaux de pointe telles que ResNet, MobileNet et DenseNet ont obtenu des performances exceptionnelles en termes de précision par rapport à leurs homologues à faible nombre d'opérations en arithmétique à virgule fixe (MACs) et à petite taille de modèle. Cependant, ces métriques peuvent ne pas être précises pour prédire le temps d'inférence. Nous suggérons que le trafic mémoire pour l'accès aux cartes de caractéristiques intermédiaires peut être un facteur dominant la latence d'inférence, en particulier dans des tâches comme la détection d'objets en temps réel et la segmentation sémantique de vidéos haute résolution. Nous proposons un réseau harmoniquement densément connecté (Harmonic Densely Connected Network) pour atteindre une efficacité élevée tant en termes de faible nombre de MACs que de trafic mémoire. Le nouveau réseau réduit respectivement les temps d'inférence de 35 %, 36 %, 30 %, 32 % et 45 % par rapport à FC-DenseNet-103, DenseNet-264, ResNet-50, ResNet-152 et SSD-VGG. Nous utilisons des outils tels que le profilateur Nvidia et ARM Scale-Sim pour mesurer le trafic mémoire et vérifier que la latence d'inférence est effectivement proportionnelle à la consommation de trafic mémoire, et que le réseau proposé consomme peu de trafic mémoire. Nous concluons qu'il convient de prendre en compte le trafic mémoire lors du design des architectures de réseaux neuronaux destinées aux applications haute résolution au bord du réseau.