HyperAI초신경

얼리버드 티켓 카운트다운 | TVM/Triton/TileLang이 같은 무대에서 각자의 실력을 선보입니다. Meet AI Compiler에서 AI 컴파일러의 무한한 가능성을 만나보세요!

特色图像

HyperAI는 7월 5일 베이징 중관촌에서 제7회 Meet AI Compiler Technology Salon을 개최합니다.이번 행사에는 AMD, Muxi Integrated Circuit, ByteDance, 그리고 베이징대학교의 선임 전문가 4명이 초대되어 저수준 컴파일부터 상위 수준 애플리케이션까지 다양한 관점에서 AI 컴파일러의 최첨단 기술을 탐구했습니다. 또한, 상하이 창즈 학원과 Apache TVM PMC의 조교수인 펑 쓰위안이 원탁 세션의 사회를 맡아 "하드웨어 전반의 통합 컴파일 생태계"라는 주제로 강연자들과 심도 있는 토론을 나눌 예정입니다.

🎫얼리버드 티켓은 오늘 23시 30분에 매진되니 서둘러 탑승하세요! 그곳에서 만나요~

행사 당일에는 모든 분들을 위해 특별한 선물과 티타임을 준비했습니다. "HyperAI Super Neuro" 공식 계정을 팔로우하시고 이벤트에 참여해 주세요! 많은 참여 부탁드립니다!

이벤트 세부 정보

⏰ 시간 : 7월 5일(토) 13:30~17:45

📍 위치: 베이징시 하이뎬구 하이뎬서가 48호, 가라지 커피

👬 인원 : 200명 (현장 좌석이 한정되어 있으니, 가능한 한 빨리 등록해 주시기 바랍니다) 

🙌🏻 등록: 링크를 입력하여 등록하세요~

https://www.huodongxing.com/event/1810501012111

QR 코드를 스캔하고 "AI 컴파일러"라고 댓글을 남겨 이벤트 그룹에 참여하세요.

📝 일정:

손님 및 일정

세션 1 게스트 공유

주제 공유:오픈 소스 커뮤니티 지원, AMD Triton 컴파일러 분석

내용물:Triton은 OpenAI에서 제안한 프로그래밍 언어로, 고성능 GPU 커널 개발을 간소화하도록 설계되었습니다. 주류 LLM 추론 학습 프레임워크에서 널리 사용되고 있습니다. 사용자는 기본 GPU 아키텍처 세부 사항에 대한 걱정 없이 Python Triton 코드를 개발하여 GPU 커널을 구현할 수 있으며, 이는 GPU 코드 개발의 어려움을 크게 줄여줍니다.

AMD는 관련 GPU 플랫폼에 Triton 컴파일러를 구현하여 Triton 오픈 소스 커뮤니티에 기여했습니다. GPU 코드 성능을 최적화하려면 Triton 컴파일러와 커널 성능 최적화에서 Triton 컴파일러의 역할을 이해해야 합니다.이 공유에서는 AMD Triton 컴파일러에 대해 자세히 설명하고, 이 컴파일러가 AMD GPU 플랫폼에서 Triton의 성능을 어떻게 개선하는지 소개합니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. AMD GPU 아키텍처 소개

2. Triton 오픈 소스 커뮤니티에서 AMD GPU의 최신 작업

주제 공유:Muxi GPU에서의 TVM 응용 프로그램 실습

내용물:이 논의는 주로 Muxi GPU에 TVM을 적용하는 방법에 초점을 맞춥니다.Muxi GPU의 경우 TVM을 중심으로 고성능 연산자가 생성되어 TVM 기반의 주류 AI 프레임워크를 활성화합니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. TVM을 국내 GPGPU에 적용 시 발생할 수 있는 문제점

2. 국내 GPGPU에 대한 TVM의 이점은 무엇이며, 어떤 측면에서 더 많은 혁신이 필요합니까?

3. 국내 GPGPU 기반 TVM 등 AI 컴파일러 지원 현황 및 관련 생태계 확장 방안 논의

주제 공유:Triton 배포: 고성능 통신을 위한 네이티브 Python 프로그래밍

내용물:단일 칩의 규모는 점차 병목 현상에 직면하고 있습니다. 단일 가속기는 대규모 언어 모델 학습 및 추론을 지원할 수 없습니다. 분산 시스템은 이제 엄격한 요구 사항이 되었습니다. 분산 시스템에서는 컴퓨팅, 메모리 접근, 통신이 동시에 이루어지지만, 기존 프레임워크는 대부분 독립적으로 최적화되어 있어 클러스터 성능을 공동으로 구현하기 어렵습니다.

본 보고서는 Triton 분산형(Triton 컴파일러 확장)을 제안하는데, 이는 분산형 AI 워크로드의 네이티브 중복 최적화를 옹호하는 최초의 방법이며 다중 프레임워크 최적화를 다룹니다.OpenSHMEM 통신 기본 요소를 통합하고 컴파일러를 사용하여 세 가지 활동의 공동 최적화를 달성하고, 중복되는 기술과 단일/다중 노드 프로그래밍 방법을 적용함으로써 생성된 코드는 클러스터 환경에서 이기종 리소스를 최대한 활용하여 수동으로 최적화된 코드보다 성능이 뛰어나고 개발 비용은 CUDA/C++보다 상당히 낮습니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. 트리톤 분산형 최신 기술

2. Python 프로그래밍 커뮤니케이션의 과제

3. 분산 컴파일의 미래 방향

주제 공유:TileLang: 운영자 개발은 더 이상 "두뇌 소모"가 아니며 성능은 여전히 온라인 상태입니다.

내용물:이번에는 새로운 연산자 프로그래밍 언어인 TileLang을 소개합니다.명시적인 타일 수준 프리미티브와 자동 추론 메커니즘을 통해 개발자는 하드웨어 기반 신경망 연산자를 효율적으로 구현하여 제어와 개발 효율성의 균형을 맞출 수 있습니다. 기존 컴파일러(예: Triton)와 비교했을 때 TileLang은 주류 GPU에서 최대 6배의 성능 향상을 달성하여 개발 프로세스를 크게 간소화하고 성능 최적화를 더 이상 "전문가의 전유물"로 여기지 않습니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. 더 간단하고 효율적인 고성능 운영자 개발 언어를 습득하세요

2. TileLang의 핵심 디자인 컨셉과 기술적 장점을 이해하세요.

세션 2 원탁토론

원탁회의 주제:하드웨어 전반에 걸친 통합 컴파일 생태계

주최자 및 파트너

HyperAI(hyper.ai)는 국제적으로 선도적인 인공 지능 및 고성능 컴퓨팅 커뮤니티로서, 업계 정보 보고서, 가속화된 데이터 세트 다운로드, 온라인 튜토리얼 데모, 인기 있는 모델 성능 평가, 최첨단 논문 권장 사항, 고가치 결과 해석, 최고의 컨퍼런스 일정 통합과 같은 일련의 서비스를 제공하여 글로벌 데이터 과학 및 인공 지능 산업의 개발자와 애호가들이 학습하고 이해하고 실습할 수 있도록 돕고, 커뮤니티와 함께 인공 지능의 미래를 구축하는 것을 목표로 합니다.

공식 웹사이트를 방문하세요:https://hyper.ai/

OpenBayes Bayesian Computing은 중국을 대표하는 고성능 컴퓨팅 서비스 제공업체입니다.기존 소프트웨어 생태계와 머신 러닝 모델을 차세대 이기종 칩에 접목하여 산업체와 대학의 과학 연구에 더 빠르고 사용하기 쉬운 데이터 과학 컴퓨팅 제품을 제공합니다. 해당 제품은 수십 개의 대규모 산업 시나리오나 주요 과학 연구 기관에서 채택되었습니다.

공식 웹사이트를 방문하세요:https://openbayes.com/

MLC.AI 커뮤니티는 2022년 6월에 설립되었습니다. Apache TVM의 주요 발명가이자 머신 러닝 분야의 저명한 젊은 학자인 천톈치가 팀을 이끌고 MLC 온라인 과정을 시작했으며, 이를 통해 머신 러닝 컴파일의 핵심 요소와 핵심 개념을 체계적으로 소개했습니다.

2022년 11월, MLC.AI 커뮤니티 자원봉사자들의 공동 노력으로 최초의 완전한 TVM 중국어 문서가 출시되어 HyperAI 공식 웹사이트에 성공적으로 호스팅되었습니다. 이를 통해 머신 러닝 컴파일에 관심이 있는 국내 개발자에게 새로운 기술인 문서에 접근하고 학습할 수 있는 기본 설정을 제공하게 되었습니다.

MLC 온라인 과정:https://mlc.ai/

TVM 중국어 문서:https://tvm.hyper.ai/

2011년 4월에 설립된 가라지커피는 중국에서 최초로 인터넷 스타트업에 초점을 맞추고, "대중 창업"을 중심으로 초창기 기업가를 위한 저렴하고 편리하며 모든 요소를 갖춘 오픈 혁신 및 창업 서비스 플랫폼을 구축한 회사입니다.

탑.

베이징 중관촌 창업가 최초의 메이커스페이스인 가라지 커피(Garage Coffee)는 커피숍을 인터랙티브 미디어로 활용하여 창업팀에게 공유, 공동 홍보, 통합, 공존을 위한 인터랙티브 오피스 공간과 인큐베이션 서비스를 제공합니다. 가라지 커피는 세계 최초의 기업가 정신을 테마로 한 커피숍이자, 중국에서 가장 영향력 있는 국내 메이커스페이스이자 국제적인 혁신 및 창업 플랫폼입니다.

이벤트 지원

활성 행:QR 코드를 스캔하여 이벤트 등록 페이지로 이동하세요

QR 코드를 스캔하고 "AI 컴파일러"라고 표시하여 이벤트 그룹에 참여하세요.

이 행사의 장소 공간 조건을 고려하여 참석 가능한 좌석을 200석으로 제한했습니다. 좌석을 확보하려면 가능한 한 일찍 등록하는 것이 좋습니다.

7월 5일 13:30부터 17:45까지 만나요!