날짜

6달 전

태그

소개

Triton은 병렬 프로그래밍을 위한 언어 및 컴파일러로, GPU 하드웨어에서 최대 처리량으로 실행될 수 있는 맞춤형 DNN 연산 커널을 효율적으로 작성할 수 있는 Python 기반 프로그래밍 환경을 제공하도록 설계되었습니다.

이 프로젝트는 벡터 연산, 행렬 연산, 레이어 정규화, 어텐션 메커니즘, FP8 행렬 곱셈 등 기초부터 고급까지 모든 측면을 다루는 완벽한 Triton 학습 튜토리얼입니다.

참고 자료

이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

Notebook 개요

수준

입문

주제

주요 프레임워크 가이드 LLM 엔지니어링 고성능 컴퓨팅

코드 예제

8 Notebooks

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 노트북 실행하기 Discord에서 논의하기

날짜

6달 전

태그

RTX 5090

AI 컴파일러

소개

참고 자료

Notebook 개요

수준

입문

주제

주요 프레임워크 가이드 LLM 엔지니어링 고성능 컴퓨팅

코드 예제

8 Notebooks

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

Triton 컴파일러 튜토리얼

소개

목차

1. 기본 작동법 안내

1.1 벡터 덧셈

2. 핵심 운영자 튜토리얼

2.1 퓨즈드 소프트맥스

2.2 행렬 곱셈

2.3 레이어 정규화

3. 고급 기능 사용법

3.1 메모리 부족으로 인한 드롭아웃

3.2 융합된 주의력

3.3 Libdevice 외부 기능

3.4 그룹화된 GEMM

3.5 연속 FP8 행렬 곱셈

3.6 블록 스케일링 행렬 곱셈

참고 자료

Notebook 개요

AI로 AI 구축

HyperAI Newsletters

Command Palette

Triton 컴파일러 튜토리얼

소개

목차

1. 기본 작동법 안내

1.1 벡터 덧셈

2. 핵심 운영자 튜토리얼

2.1 퓨즈드 소프트맥스

2.2 행렬 곱셈

2.3 레이어 정규화

3. 고급 기능 사용법

3.1 메모리 부족으로 인한 드롭아웃

3.2 융합된 주의력

3.3 Libdevice 외부 기능

3.4 그룹화된 GEMM

3.5 연속 FP8 행렬 곱셈

3.6 블록 스케일링 행렬 곱셈

참고 자료

Notebook 개요

AI로 AI 구축

HyperAI Newsletters

Command Palette

Triton 컴파일러 튜토리얼

소개

목차

1. 기본 작동법 안내

1.1 벡터 덧셈

2. 핵심 운영자 튜토리얼

2.1 퓨즈드 소프트맥스

2.2 행렬 곱셈

2.3 레이어 정규화

3. 고급 기능 사용법

3.1 메모리 부족으로 인한 드롭아웃

3.2 융합된 주의력

3.3 Libdevice 외부 기능

3.4 그룹화된 GEMM

3.5 연속 FP8 행렬 곱셈

3.6 블록 스케일링 행렬 곱셈

참고 자료

Notebook 개요

AI로 AI 구축

HyperAI Newsletters