HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 3 mois

L'hypothèse du ticket de loterie : Recherche de réseaux neuronaux creux entraînables

{Michael Carbin Jonathan Frankle}

L'hypothèse du ticket de loterie : Recherche de réseaux neuronaux creux entraînables

Résumé

Les techniques de taille des réseaux de neurones permettent de réduire le nombre de paramètres des réseaux entraînés de plus de 90 %, ce qui diminue les besoins en stockage et améliore les performances computationnelles du débogage, sans compromettre l’exactitude. Toutefois, l’expérience actuelle montre que les architectures creuses produites par la taille sont difficiles à entraîner à partir de zéro, ce qui pourrait toutefois améliorer les performances d’entraînement. Nous constatons qu’une technique standard de taille révèle naturellement des sous-réseaux dont les initialisations les rendent capables d’être entraînés efficacement. À partir de ces résultats, nous formulons l’hypothèse du « ticket gagnant » : les réseaux feed-forward denses et initialement aléatoires contiennent des sous-réseaux (« tickets gagnants ») qui, lorsqu’ils sont entraînés isolément, atteignent une précision de test comparable à celle du réseau original en un nombre d’itérations similaire. Les tickets gagnants que nous identifions ont remporté la loterie d’initialisation : leurs connexions possèdent des poids initiaux qui rendent l’entraînement particulièrement efficace. Nous présentons un algorithme permettant d’identifier les tickets gagnants, ainsi qu’une série d’expériences qui soutiennent l’hypothèse du ticket gagnant et l’importance de ces initialisations fortuites. Nous trouvons systématiquement des tickets gagnants dont la taille est inférieure à 10 à 20 % de plusieurs architectures fully-connected et convolutionnelles feed-forward sur les jeux de données MNIST et CIFAR10. Au-delà de cette taille, les tickets gagnants que nous identifions s’entraînent plus rapidement que le réseau original et atteignent une précision de test élevée.

Dépôts de code

hdo0947/Lottery-Ticket-Hypothesis
pytorch
Mentionné dans GitHub
SirBubbls/condense
Mentionné dans GitHub
reallygooday/60daysofudacity
pytorch
Mentionné dans GitHub
Theys96/lottery-ticket-hypothesis
tf
Mentionné dans GitHub
Happy-Virus-IkBeom/LTH_Tensorflow
tf
Mentionné dans GitHub
emerali/LottoRBM
pytorch
Mentionné dans GitHub
JingtongSu/sanity-checking-pruning
pytorch
Mentionné dans GitHub
Taoudi/LotteryTicketHypothesis
tf
Mentionné dans GitHub
kosnil/signed_supermasks
tf
Mentionné dans GitHub
ARMargolis/melanoma-pytorch
pytorch
Mentionné dans GitHub
luuyin/lottery-pools
pytorch
Mentionné dans GitHub
matthew-mcateer/Keras_pruning
tf
Mentionné dans GitHub
gcastex/PruNet
pytorch
Mentionné dans GitHub
ismail31416/colt
pytorch
Mentionné dans GitHub
facebookresearch/open_lth
pytorch
Mentionné dans GitHub
phiandark/SiftingFeatures
tf
Mentionné dans GitHub
Mraksu/Lottery-Ticket
tf
Mentionné dans GitHub

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
L'hypothèse du ticket de loterie : Recherche de réseaux neuronaux creux entraînables | Articles de recherche | HyperAI