HyperAIHyperAI

Command Palette

Search for a command to run...

Kernels GPU pour les poids creux par blocs

Alec Radford and Diederik P. Kingma Scott Gray

Résumé

Nous mettons désormais à disposition des noyaux GPU fortement optimisés pour une classe de réseaux neuronaux sous-étudiée : les architectures comportant des poids à structure bloc-creuse. Ces noyaux permettent une évaluation et une différenciation efficaces des couches linéaires, y compris les couches de convolution, avec des motifs de sparsité bloc flexible dans la matrice de poids. Nous constatons que, selon le degré de sparsité, ces noyaux peuvent être plusieurs ordres de grandeur plus rapides que les solutions disponibles les plus performantes, telles que cuBLAS. En utilisant ces noyaux, nous améliorons les résultats actuels de l’état de l’art en analyse de sentiment textuel ainsi qu’en modélisation générative de texte et d’images. En rendant ces noyaux accessibles sous licence open source, nous souhaitons stimuler davantage l’avancement dans la conception de modèles et d’algorithmes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Kernels GPU pour les poids creux par blocs | Articles | HyperAI