il y a 5 mois

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan

Résumé

Les charges de travail modernes en intelligence artificielle s'appuient fortement sur des noyaux informatiques optimisés, tant pour l'entraînement que pour l'inférence. Ces noyaux d'IA suivent des schémas de flux de données bien définis, tels que le déplacement de tuiles entre la DRAM et la SRAM, ainsi que l'application d'une séquence de calculs sur ces tuiles. Toutefois, la rédaction de noyaux à haute performance reste complexe, malgré la clarté de ces schémas. Pour atteindre les performances maximales, des optimisations soigneuses et centrées sur l'architecture matérielle sont nécessaires afin d'exploiter pleinement les accélérateurs modernes. Bien que les compilateurs spécifiques à domaine cherchent à réduire la charge liée à l'écriture de noyaux performants, ils peinent souvent à combler les écarts en matière d'utilisabilité et d'expressivité. Dans cet article, nous présentons TileLang, un modèle de programmation généralisé basé sur le découpage en tuiles, visant à améliorer l'efficacité du développement de noyaux d'IA. TileLang sépare l'espace de planification (liaison des threads, disposition, tensorisation et pipeline) du flux de données, et en encapsule les éléments sous forme d'annotations personnalisables et de primitives. Cette approche permet aux utilisateurs de se concentrer sur le flux de données propre au noyau, tout en laissant la majorité des optimisations aux compilateurs. Nous menons des expériences approfondies sur des dispositifs couramment utilisés, à travers de nombreuses évaluations, nos résultats montrent que TileLang atteint des performances de pointe sur des noyaux clés, démontrant ainsi que son paradigme unifié de blocs et de threads, combiné à des capacités de planification transparentes, offre à la fois la puissance et la flexibilité requises par le développement des systèmes d'IA modernes.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 5 mois

Compilateur IA

TVM

Apprentissage Profond

Domaine De Recherche

Infrastructure D'ia

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 5 mois

Compilateur IA

TVM

Apprentissage Profond

Domaine De Recherche

Infrastructure D'ia

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan

Wang Lei Cheng Yu Shi Yining Tang Zhengju Mo Zhiwen Xie Wenhao Ma Lingxiao Xia Yuqing Xue Jilong Yang Fan