Command Palette
Search for a command to run...
Tutoriel Sur Le Compilateur Triton
An error occurred in the Server Components render. The specific message is omitted in production builds to avoid leaking sensitive details. A digest property is included on this error instance which may provide additional details about the nature of the error.
Failed to load notebook detailsIntroduction
Triton est un langage et un compilateur pour la programmation parallèle, conçu pour fournir un environnement de programmation basé sur Python permettant d'écrire efficacement des noyaux de calcul DNN personnalisés capables de fonctionner à débit maximal sur du matériel GPU.
Ce projet est un tutoriel d'apprentissage complet sur Triton, couvrant tous les aspects, des bases aux techniques avancées, y compris les opérations vectorielles, les opérations matricielles, la normalisation des couches, les mécanismes d'attention et la multiplication matricielle FP8.
Table des matières
1. Tutoriel sur les opérations de base
1.1 Addition vectorielle
- 01-vector-add.cn.ipynb – Un tutoriel d'introduction à l'addition vectorielle, présentant le modèle de programmation de base de Triton.
2. Tutoriel sur l'opérateur principal
2.1 Softmax fusionné
- 02-fused-softmax.cn.ipynb – Intégrer les opérations Softmax pour apprendre les opérations de fusion et de réduction de noyau.
2.2 Multiplication matricielle
- 03-matrix-multiplication.cn.ipynb Implémentation de multiplication matricielle haute performance
2.3 Normalisation des couches
- 05-layer-norm.cn.ipynb – Implémentation de l'opérateur de normalisation de couche
3. Tutoriel sur les fonctionnalités avancées
3.1 Décrochage en cas de faible mémoire
- 04-low-memory-dropout.cn.ipynb – Implémentation Dropout optimisée en mémoire
3.2 Attention fusionnée
- 06-fusion-attention.cn.ipynb – Mise en œuvre du mécanisme d'attention du Transformer
3.3 Fonctions externes de Libdevice
- 07-extern-functions.cn.ipynb – Utilisation de la bibliothèque externe tl_extra.libdevice
3.4 GEMM groupé
- 08-grouped-gemm.cn.ipynb – Implémentation de la multiplication matricielle générale groupée
3.5 Multiplication matricielle FP8 continue
- 09-persistent-matmul.cn.ipynb – Optimisation de la multiplication matricielle avec une précision FP8
3.6 Multiplication de matrices de mise à l'échelle par blocs
- 10-block-scaled-matmul.cn.ipynb – Implémentation de la multiplication matricielle par mise à l'échelle par blocs
Ressources de référence
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.