HyperAIHyperAI

Command Palette

Search for a command to run...

AC/DC : Entraînement alterné compressé/décompressé des réseaux de neurones profonds

Alexandra Peste Eugenia Iofinova Adrian Vladu Dan Alistarh

Résumé

Les besoins computationnels croissants des réseaux de neurones profonds (DNN) ont suscité un intérêt marqué pour l’obtention de modèles DNN à la fois creux (sparse) et précis. Des travaux récents ont exploré le cas encore plus difficile de l’entraînement creux, dans lequel les poids du DNN sont, autant que possible, déjà creux dès le départ, afin de réduire les coûts computationnels durant l’entraînement. Les méthodes d’entraînement creux existantes sont souvent empiriques et peuvent présenter une précision inférieure par rapport à une référence dense. Dans cet article, nous proposons une approche générale appelée entraînement alterné compressé/décompressé (AC/DC) pour les DNN, démontrons la convergence pour une variante de l’algorithme, et montrons que l’AC/DC surpasse les méthodes existantes d’entraînement creux en précision, pour un budget computationnel similaire ; à des niveaux élevés de densité creuse, l’AC/DC dépasse même les méthodes existantes qui reposent sur des modèles denses pré-entraînés précis. Une propriété importante de l’AC/DC est qu’elle permet l’entraînement conjoint (co-training) de modèles denses et creux, produisant à la fin du processus des paires de modèles creux-denses précis. Cela s’avère utile en pratique, lorsque des variantes compressées sont souhaitables pour le déploiement dans des environnements à ressources limitées, sans avoir à répéter l’intégralité du processus d’entraînement, et fournit également des éclaircissements sur l’écart de précision entre modèles denses et modèles compressés. Le code est disponible à l’adresse suivante : https://github.com/IST-DASLab/ACDC .


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp