il y a 7 mois

Résumé

Les réseaux profonds exécutés avec des opérations de faible précision au moment de l'inférence offrent des avantages en termes de puissance et d'espace par rapport aux alternatives à haute précision, mais ils doivent surmonter le défi de maintenir une haute précision lorsque la précision diminue. Dans cet article, nous présentons une méthode pour entraîner ces réseaux, appelée Quantification avec Apprentissage du Pas (Learned Step Size Quantization), qui atteint la plus haute précision à ce jour sur le jeu de données ImageNet lorsqu'on utilise des modèles, issus de diverses architectures, avec des poids et des activations quantifiés à 2, 3 ou 4 bits de précision, et qui peut entraîner des modèles à 3 bits atteignant la précision de base à pleine précision. Notre approche s'appuie sur les méthodes existantes pour apprendre les poids dans les réseaux quantifiés en améliorant la configuration du quantificateur lui-même. Plus précisément, nous introduisons un moyen novateur d'estimer et d'échelonner le gradient de la perte de tâche à chaque étape du quantificateur des couches de poids et d'activations, afin qu'il puisse être appris conjointement avec les autres paramètres du réseau. Cette méthode fonctionne avec différents niveaux de précision selon les besoins du système donné et ne nécessite qu'une modification simple du code d'entraînement existant.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Réseau De Neurones Convolutif

Entraînement Du Modèle

Approche/Framework

Vision Par Ordinateur

Tâche

Steven K. Esser; Jeffrey L. McKinstry; Deepika Bablani; Rathinakumar Appuswamy; Dharmendra S. Modha

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

Réseau De Neurones Convolutif

Entraînement Du Modèle

Approche/Framework

Vision Par Ordinateur

Tâche

Steven K. Esser; Jeffrey L. McKinstry; Deepika Bablani; Rathinakumar Appuswamy; Dharmendra S. Modha

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Apprentissage de la Taille des Pas pour la Quantification

Steven K. Esser; Jeffrey L. McKinstry; Deepika Bablani; Rathinakumar Appuswamy; Dharmendra S. Modha

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage de la Taille des Pas pour la Quantification

Steven K. Esser; Jeffrey L. McKinstry; Deepika Bablani; Rathinakumar Appuswamy; Dharmendra S. Modha

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprentissage de la Taille des Pas pour la Quantification

Steven K. Esser; Jeffrey L. McKinstry; Deepika Bablani; Rathinakumar Appuswamy; Dharmendra S. Modha

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters