Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 15 Tagen

Größe

657.01 MB

Einführung

Triton ist eine Sprache und ein Compiler für die parallele Programmierung, der eine Python-basierte Programmierumgebung für das effiziente Schreiben benutzerdefinierter DNN-Berechnungskerne bietet, die mit maximalem Durchsatz auf GPU-Hardware ausgeführt werden können.

Dieses Projekt ist ein vollständiges Triton-Lern-Tutorial, das alle Aspekte von den Grundlagen bis zu fortgeschrittenen Themen abdeckt, einschließlich Vektoroperationen, Matrixoperationen, Layer-Normalisierung, Aufmerksamkeitsmechanismen und FP8-Matrixmultiplikation.

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

01-vector-add.cn.ipynb – Ein einführendes Tutorial zur Vektoraddition, das das grundlegende Triton-Programmiermodell vorstellt.

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

02-fused-softmax.cn.ipynb – Integrieren Sie Softmax-Operationen, um Kernel-Fusions- und Reduktionsoperationen zu erlernen.

2.2 Matrizenmultiplikation

03-matrix-multiplication.cn.ipynb Hochleistungsfähige Implementierung der Matrixmultiplikation

2.3 Ebenennormalisierung

05-layer-norm.cn.ipynb – Implementierung des Layer-Normalisierungsoperators

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

04-low-memory-dropout.cn.ipynb – Speicheroptimierte Dropout-Implementierung

3.2 Verschmolzene Aufmerksamkeit

06-fused-attention.cn.ipynb – Implementierung des Transformer-Aufmerksamkeitsmechanismus

3.3 Externe Libdevice-Funktionen

07-extern-functions.cn.ipynb – Verwendung der externen Bibliothek tl_extra.libdevice

3.4 Gruppiertes GEMM

08-grouped-gemm.cn.ipynb – Gruppierte allgemeine Matrixmultiplikationsimplementierung

3.5 Kontinuierliche FP8-Matrixmultiplikation

09-persistent-matmul.cn.ipynb – Optimierung der Matrixmultiplikation mit FP8-Genauigkeit

3.6 Blockskalierung Matrixmultiplikation

10-block-scaled-matmul.cn.ipynb – Implementierung der Matrixmultiplikation mit Blockskalierung

Referenzressourcen

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 15 Tagen

Größe

657.01 MB

Einführung

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

01-vector-add.cn.ipynb – Ein einführendes Tutorial zur Vektoraddition, das das grundlegende Triton-Programmiermodell vorstellt.

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

02-fused-softmax.cn.ipynb – Integrieren Sie Softmax-Operationen, um Kernel-Fusions- und Reduktionsoperationen zu erlernen.

2.2 Matrizenmultiplikation

03-matrix-multiplication.cn.ipynb Hochleistungsfähige Implementierung der Matrixmultiplikation

2.3 Ebenennormalisierung

05-layer-norm.cn.ipynb – Implementierung des Layer-Normalisierungsoperators

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

04-low-memory-dropout.cn.ipynb – Speicheroptimierte Dropout-Implementierung

3.2 Verschmolzene Aufmerksamkeit

06-fused-attention.cn.ipynb – Implementierung des Transformer-Aufmerksamkeitsmechanismus

3.3 Externe Libdevice-Funktionen

07-extern-functions.cn.ipynb – Verwendung der externen Bibliothek tl_extra.libdevice

3.4 Gruppiertes GEMM

08-grouped-gemm.cn.ipynb – Gruppierte allgemeine Matrixmultiplikationsimplementierung

3.5 Kontinuierliche FP8-Matrixmultiplikation

09-persistent-matmul.cn.ipynb – Optimierung der Matrixmultiplikation mit FP8-Genauigkeit

3.6 Blockskalierung Matrixmultiplikation

10-block-scaled-matmul.cn.ipynb – Implementierung der Matrixmultiplikation mit Blockskalierung

Referenzressourcen

Verwandt Notebooks

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Triton Compiler Tutorial

Einführung

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

2.2 Matrizenmultiplikation

2.3 Ebenennormalisierung

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

3.2 Verschmolzene Aufmerksamkeit

3.3 Externe Libdevice-Funktionen

3.4 Gruppiertes GEMM

3.5 Kontinuierliche FP8-Matrixmultiplikation

3.6 Blockskalierung Matrixmultiplikation

Referenzressourcen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Triton Compiler Tutorial

Einführung

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

2.2 Matrizenmultiplikation

2.3 Ebenennormalisierung

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

3.2 Verschmolzene Aufmerksamkeit

3.3 Externe Libdevice-Funktionen

3.4 Gruppiertes GEMM

3.5 Kontinuierliche FP8-Matrixmultiplikation

3.6 Blockskalierung Matrixmultiplikation

Referenzressourcen

Verwandt Notebooks

TVM-Tutorial 0.22.0

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

MarkItDown, Microsofts Open-Source-Dokumentkonvertierungstool

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Triton Compiler Tutorial

Einführung

Inhaltsverzeichnis

1. Grundlegende Bedienungsanleitung

1.1 Vektoraddition

2. Tutorial zu Kernoperatoren

2.1 Verschmolzenes Softmax

2.2 Matrizenmultiplikation

2.3 Ebenennormalisierung

3. Tutorial zu erweiterten Funktionen

3.1 Speichermangel

3.2 Verschmolzene Aufmerksamkeit

3.3 Externe Libdevice-Funktionen

3.4 Gruppiertes GEMM

3.5 Kontinuierliche FP8-Matrixmultiplikation

3.6 Blockskalierung Matrixmultiplikation

Referenzressourcen

Verwandt Notebooks

TVM-Tutorial 0.22.0

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

MarkItDown, Microsofts Open-Source-Dokumentkonvertierungstool

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Notebooks

TVM-Tutorial 0.22.0

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

MarkItDown, Microsofts Open-Source-Dokumentkonvertierungstool

Verwandt Notebooks

TVM-Tutorial 0.22.0

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

SmolLM3-3B-Modell Mit Einem Klick Bereitstellen

MarkItDown, Microsofts Open-Source-Dokumentkonvertierungstool