HyperAIHyperAI
il y a 2 mois

Podage par Ordre Partiel : pour le Meilleur Compromis Vitesse/Précision dans la Recherche d'Architecture de Réseaux Neuronaux

Xin Li; Yiming Zhou; Zheng Pan; Jiashi Feng
Podage par Ordre Partiel : pour le Meilleur Compromis Vitesse/Précision dans la Recherche d'Architecture de Réseaux Neuronaux
Résumé

Atteindre un bon compromis entre vitesse et précision sur une plateforme cible est très important pour le déploiement des réseaux de neurones profonds dans des scénarios réels. Cependant, la plupart des approches actuelles de recherche automatique d'architecture se concentrent uniquement sur les hautes performances. Dans ce travail, nous proposons un algorithme qui peut offrir un meilleur compromis entre vitesse et précision pour les réseaux recherchés, appelé « Prune de Ordre Partiel » (Partial Order Pruning). Il réduit l'espace de recherche d'architecture en utilisant une hypothèse d'ordre partiel pour rechercher automatiquement les architectures présentant le meilleur compromis entre vitesse et précision. Notre algorithme prend explicitement en compte des informations de profil concernant la vitesse d'inférence sur la plateforme cible. Grâce à cet algorithme proposé, nous présentons plusieurs réseaux Dongfeng (DF) qui offrent une haute précision et une vitesse d'inférence rapide sur diverses plateformes GPU applicatives. En recherchant davantage les architectures de décodeur, nos réseaux de segmentation en temps réel DF-Seg obtiennent un compromis entre vitesse et précision à la pointe de l'état de l'art, tant sur le dispositif embarqué cible que sur le GPU haut de gamme.

Podage par Ordre Partiel : pour le Meilleur Compromis Vitesse/Précision dans la Recherche d'Architecture de Réseaux Neuronaux | Articles de recherche récents | HyperAI