HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux neuronaux graphiques avec attention croisée de configuration pour les compilateurs de tenseurs

Dmitrii Khizbulin Eduardo Rocha de Andrade Thanh Hau Nguyen Matheus Pedroza Ferreira David R. Pugh

Résumé

Avec la popularité récente des réseaux de neurones, il existe un besoin croissant d'une gestion efficace des charges de travail d'inférence. Une charge de travail d'inférence de réseau de neurones peut être représentée sous forme de graphe computationnel, où les nœuds sont des opérateurs transformant des tenseurs multidimensionnels. Les tenseurs peuvent être transposés et/ou divisés en tuiles selon un nombre combinatoirement grand de façons, certaines configurations conduisant à une inférence accélérée. Nous proposons TGraph, une architecture de graphe neuronal qui permet d'évaluer rapidement les configurations optimales du graphe computationnel cible, constituant ainsi un compilateur de tenseurs d'intelligence artificielle (IA) en opposition avec les compilateurs traditionnels basés sur des heuristiques. La solution proposée améliore le tau (τ\tauτ) moyen de Kendall dans les collections de dispositions de TpuGraphs, passant de 29,8 % pour la ligne de base fiable à 67,4 % pour TGraph. Nous estimons que la réduction potentielle des émissions de CO2_22 associée à notre travail est équivalente à plus de 50 % des émissions totales des ménages dans les zones abritant des centres de données orientés vers l'IA.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp