HyperAIHyperAI

Command Palette

Search for a command to run...

Triton Compiler Tutorial

Datum

vor 15 Tagen

Größe

657.01 MB

Einführung

Triton ist eine Sprache und ein Compiler für die parallele Programmierung, der eine Python-basierte Programmierumgebung für das effiziente Schreiben benutzerdefinierter DNN-Berechnungskerne bietet, die mit maximalem Durchsatz auf GPU-Hardware ausgeführt werden können.

Dieses Projekt ist ein vollständiges Triton-Lern-Tutorial, das alle Aspekte von den Grundlagen bis zu fortgeschrittenen Themen abdeckt, einschließlich Vektoroperationen, Matrixoperationen, Layer-Normalisierung, Aufmerksamkeitsmechanismen und FP8-Matrixmultiplikation.

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

  • 01-vector-add.cn.ipynb – Ein einführendes Tutorial zur Vektoraddition, das das grundlegende Triton-Programmiermodell vorstellt.

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

  • 02-fused-softmax.cn.ipynb – Integrieren Sie Softmax-Operationen, um Kernel-Fusions- und Reduktionsoperationen zu erlernen.

2.2 Matrizenmultiplikation

2.3 Ebenennormalisierung

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

3.2 Verschmolzene Aufmerksamkeit

3.3 Externe Libdevice-Funktionen

3.4 Gruppiertes GEMM

3.5 Kontinuierliche FP8-Matrixmultiplikation

3.6 Blockskalierung Matrixmultiplikation

Referenzressourcen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp