HyperAIHyperAI

Command Palette

Search for a command to run...

Triton 编译器教程

An error occurred in the Server Components render. The specific message is omitted in production builds to avoid leaking sensitive details. A digest property is included on this error instance which may provide additional details about the nature of the error.

Failed to load notebook details

简介

Triton 是一种用于并行编程的语言和编译器,旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在 GPU 硬件上以最大吞吐量运行。

本项目是一套完整的 Triton 学习教程,涵盖了从基础到高级的各个方面,包括向量操作、矩阵运算、层标准化、注意力机制、以及 FP8 矩阵乘法等内容。

目录

1. 基础操作教程

1.1 向量相加

2. 核心算子教程

2.1 融合 Softmax (Fused Softmax)

2.2 矩阵乘法

2.3 层标准化 (Layer Normalization)

3. 高级特性教程

3.1 低内存 Dropout

3.2 融合注意力 (Fused Attention)

3.3 Libdevice 外部函数

3.4 分组 GEMM (Grouped GEMM)

3.5 持续 FP8 矩阵乘法

3.6 块缩放矩阵乘法

参考资源

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供