HyperAIHyperAI

Command Palette

Search for a command to run...

Triton 컴파일러 튜토리얼

날짜

4달 전

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)
지금 사용하기

소개

Triton은 병렬 프로그래밍을 위한 언어 및 컴파일러로, GPU 하드웨어에서 최대 처리량으로 실행될 수 있는 맞춤형 DNN 연산 커널을 효율적으로 작성할 수 있는 Python 기반 프로그래밍 환경을 제공하도록 설계되었습니다.

이 프로젝트는 벡터 연산, 행렬 연산, 레이어 정규화, 어텐션 메커니즘, FP8 행렬 곱셈 등 기초부터 고급까지 모든 측면을 다루는 완벽한 Triton 학습 튜토리얼입니다.

목차

1. 기본 작동법 안내

1.1 벡터 덧셈

  • 01-vector-add.cn.ipynb 벡터 덧셈에 대한 입문 튜토리얼로, Triton 프로그래밍의 기본 모델을 소개합니다.

2. 핵심 운영자 튜토리얼

2.1 퓨즈드 소프트맥스

  • 02-fused-softmax.cn.ipynb - 커널 융합 및 축소 연산을 학습하기 위해 소프트맥스 연산을 통합합니다.

2.2 행렬 곱셈

2.3 레이어 정규화

3. 고급 기능 사용법

3.1 메모리 부족으로 인한 드롭아웃

3.2 융합된 주의력

3.3 Libdevice 외부 기능

3.4 그룹화된 GEMM

3.5 연속 FP8 행렬 곱셈

3.6 블록 스케일링 행렬 곱셈

참고 자료

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp