HyperAIHyperAI

Command Palette

Search for a command to run...

Triton Compiler Tutorial

An error occurred in the Server Components render. The specific message is omitted in production builds to avoid leaking sensitive details. A digest property is included on this error instance which may provide additional details about the nature of the error.

Failed to load notebook details

Einführung

Triton ist eine Sprache und ein Compiler für die parallele Programmierung, der eine Python-basierte Programmierumgebung für das effiziente Schreiben benutzerdefinierter DNN-Berechnungskerne bietet, die mit maximalem Durchsatz auf GPU-Hardware ausgeführt werden können.

Dieses Projekt ist ein vollständiges Triton-Lern-Tutorial, das alle Aspekte von den Grundlagen bis zu fortgeschrittenen Themen abdeckt, einschließlich Vektoroperationen, Matrixoperationen, Layer-Normalisierung, Aufmerksamkeitsmechanismen und FP8-Matrixmultiplikation.

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

  • 01-vector-add.cn.ipynb – Ein einführendes Tutorial zur Vektoraddition, das das grundlegende Triton-Programmiermodell vorstellt.

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

  • 02-fused-softmax.cn.ipynb – Integrieren Sie Softmax-Operationen, um Kernel-Fusions- und Reduktionsoperationen zu erlernen.

2.2 Matrizenmultiplikation

2.3 Ebenennormalisierung

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

3.2 Verschmolzene Aufmerksamkeit

3.3 Externe Libdevice-Funktionen

3.4 Gruppiertes GEMM

3.5 Kontinuierliche FP8-Matrixmultiplikation

3.6 Blockskalierung Matrixmultiplikation

Referenzressourcen

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp