HyperAIHyperAI

Command Palette

Search for a command to run...

Triton コンパイラチュートリアル

日付

15日前

サイズ

657.01 MB

導入

Triton は並列プログラミング用の言語とコンパイラであり、GPU ハードウェア上で最大のスループットで実行できるカスタム DNN 計算カーネルを効率的に記述するための Python ベースのプログラミング環境を提供するように設計されています。

このプロジェクトは、ベクトル演算、行列演算、レイヤーの正規化、アテンション メカニズム、FP8 行列乗算など、基本から高度まであらゆる側面を網羅した完全な Triton 学習チュートリアルです。

目次

1. 基本操作チュートリアル

1.1 ベクトルの加算

  • 01-vector-add.cn.ipynb – 基本的な Triton プログラミング モデルを紹介する、ベクトル加算の入門チュートリアル。

2. コアオペレータチュートリアル

2.1 融合ソフトマックス

2.2 行列の乗算

2.3 レイヤーの正規化

3. 高度な機能のチュートリアル

3.1 低メモリドロップアウト

3.2 融合注意

3.3 Libdevice外部関数

3.4 グループ化されたGEMM

3.5 連続FP8行列乗算

3.6 ブロックスケーリング行列乗算

参考資料

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています