HyperAI초신경

빅 모델 시대를 맞아 컴파일러가 다시 주목을 받고 있습니다. 7월 5일, HyperAI는 베이징 중관춘에서 제7회 AI 컴파일러 기술 살롱(Meet AI Compiler Technology Salon)을 개최하여 분산 통신, 국내 GPU 컴파일 스택, 새로운 프로그래밍 언어 설계, 그리고 오픈 소스 생태계 구축에 중점을 두었습니다. AMD, Muxi Integrated Circuits, ByteDance, 그리고 베이징대학교의 선임 AI 컴파일러 전문가들이 초청되어 각자의 기술 경로를 중심으로 "실제로 구현되고 있으며 실질적인 성과를 거두고 있는" 프로젝트의 핵심 메커니즘과 구현 세부 사항을 체계적으로 발표했습니다.

위챗 공개 계정 "HyperAI Super Neuro"를 팔로우하고 키워드 "0705 AI Compiler"에 답글을 달면 공인 강사의 발표 PPT를 받으실 수 있습니다.

원탁 세션에서는 상하이 창즈 학원 겸 아파치 TVM PMC의 조교수인 펑 시위안이 사회를 맡았습니다. 그는 "하드웨어 전반의 통합 컴파일 생태계"라는 주제에 초점을 맞춰 4명의 강사와 다양한 하드웨어 플랫폼의 협업 및 과제에 대해 심도 있게 논의했습니다.

이번 행사는 강연자들의 "지식 공유"뿐만 아니라 커뮤니티 파트너들과의 소통 또한 매우 흥미진진했습니다. 기술적인 세부 사항에 대한 심도 있는 질문, 솔루션 선택에 대한 심도 있는 논의, 티타임 동안의 자유로운 교류 등 모든 참가자들이 거리낌 없이 자신의 경험과 통찰력을 공유하고, 직면한 실질적인 문제들에 대해 따뜻하고 진솔한 대화를 나누었습니다. 이러한 "쌍방향" 분위기는 우리 기술 커뮤니티를 더욱 따뜻하게 만들어 줄 것입니다! 이번 기술 살롱은 무사히 마무리되었습니다.

이벤트 콘텐츠 리뷰

다음은 공유 콘텐츠와 실제 공유 기사에 대한 간략한 소개입니다.

주제 공유:오픈 소스 커뮤니티 지원, AMD Triton 컴파일러 분석

내용물:Triton은 OpenAI에서 제안한 프로그래밍 언어로, 고성능 GPU 커널 개발을 간소화하도록 설계되었습니다. 주류 LLM 추론 학습 프레임워크에서 널리 사용되고 있습니다. 사용자는 기본 GPU 아키텍처 세부 사항에 대한 걱정 없이 Python Triton 코드를 개발하여 GPU 커널을 구현할 수 있으며, 이는 GPU 코드 개발의 어려움을 크게 줄여줍니다.

AMD는 관련 GPU 플랫폼에 Triton 컴파일러를 구현하여 Triton 오픈 소스 커뮤니티에 기여했습니다.GPU 코드 성능을 최적화하려면 Triton 컴파일러와 커널 성능 최적화에서 Triton 컴파일러의 역할을 이해해야 합니다. 이 글에서는 AMD Triton 컴파일러에 대해 자세히 살펴보고, 이 컴파일러가 AMD GPU 플랫폼에서 Triton의 성능을 어떻게 향상시키는지 소개합니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. AMD GPU 아키텍처 소개

2. Triton 오픈 소스 커뮤니티에서 AMD GPU의 최신 작업

전체 공유 기록을 보려면 클릭하세요.

AMD AI 아키텍트 장닝: 다양한 관점에서 AMD Triton 컴파일러를 분석하여 오픈 소스 생태계 구축 지원

주제 공유:Muxi GPU에서의 TVM 응용 프로그램 실습

내용물:이 논의는 주로 Muxi GPU에 TVM을 적용하는 방법에 초점을 맞춥니다.Muxi GPU의 경우 TVM을 중심으로 고성능 연산자가 생성되어 TVM 기반의 주류 AI 프레임워크를 활성화합니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. TVM을 국내 GPGPU에 적용 시 발생할 수 있는 문제점

2. 국내 GPGPU에 대한 TVM의 이점은 무엇이며, 어떤 측면에서 더 많은 혁신이 필요합니까?

3. 국내 GPGPU 기반 TVM 등 AI 컴파일러 지원 현황 및 관련 생태계 확장 방안 논의

전체 공유 기록을 보려면 클릭하세요.

건축적 특징에서 생태계 구축까지 Muxi Dong Zhaohua는 국내 GPU에서 TVM의 적용 사례를 심층적으로 분석합니다.

주제 공유:Triton 배포: 고성능 통신을 위한 네이티브 Python 프로그래밍

내용물:단일 칩의 규모는 점차 병목 현상에 직면하고 있습니다. 단일 가속기는 대규모 언어 모델 학습 및 추론을 지원할 수 없습니다. 분산 시스템은 이제 엄격한 요구 사항이 되었습니다. 분산 시스템에서는 컴퓨팅, 메모리 접근, 통신이 동시에 이루어지지만, 기존 프레임워크는 대부분 독립적으로 최적화되어 있어 클러스터 성능을 공동으로 구현하기 어렵습니다.

본 보고서는 Triton 분산형(Triton 컴파일러 확장)을 제안하는데, 이는 분산형 AI 워크로드의 네이티브 중복 최적화를 옹호하는 최초의 방법이며 다중 프레임워크 최적화를 다룹니다.OpenSHMEM 통신 기본 요소를 통합하고 컴파일러를 사용하여 세 가지 활동의 공동 최적화를 달성하고, 중복되는 기술과 단일/다중 노드 프로그래밍 방법을 적용함으로써 생성된 코드는 클러스터 환경에서 이기종 리소스를 최대한 활용하여 수동으로 최적화된 코드보다 성능이 뛰어나고 개발 비용은 CUDA/C++보다 상당히 낮습니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. 트리톤 분산형 최신 기술

2. Python 프로그래밍 커뮤니케이션의 과제

3. 분산 컴파일의 미래 방향

전체 공유 기록을 보려면 클릭하세요.

학습 성능이 크게 향상되었습니다. Bytedance의 Zheng Size는 대규모 모델에 대한 효율적인 분산 통신 및 컴퓨팅 통합을 달성하기 위한 Triton 분산 프레임워크를 설명합니다.

주제 공유:TileLang: 운영자 개발은 더 이상 "두뇌 소모"가 아니며 성능은 여전히 온라인 상태입니다.

내용물:이번에는 새로운 연산자 프로그래밍 언어인 TileLang을 소개합니다.명시적인 타일 수준 기본 요소와 자동 추론 메커니즘을 통해 개발자는 하드웨어 인식 신경 연산자를 효율적으로 구현하여 제어와 개발 효율성의 균형을 맞출 수 있습니다.

이 공유 세션을 시청하면 다음 내용을 배울 수 있습니다.

1. 더 간단하고 효율적인 고성능 운영자 개발 언어를 습득하세요

2. TileLang의 핵심 디자인 컨셉과 기술적 장점을 이해하세요.

전체 공유 기록을 보려면 클릭하세요.

타일 수준 기본 요소는 자동 추론 메커니즘과 통합되어 있습니다. TileAI 커뮤니티의 창시자는 TileLang의 핵심 기술과 장점을 심층적으로 분석합니다.

2025년 AI 컴파일러를 만나보세요 · 계속 지켜봐주세요

2023년부터 2025년까지 베이징, 상하이, 선전에서 7차례의 오프라인 밋업을 성공적으로 개최하여 수천 명의 시니어 실무자와 열정적인 참여자를 모았고, 점차 풍부한 커뮤니티 생태계를 구축했습니다. 2025년에는 AI 컴파일러 시티 맵을 지속적으로 개발하고, 모든 기업과 커뮤니티 파트너들이 강사 추천, 장소 제공, 커피 브레이크 제공 등 다양한 형태로 공동 창작에 참여해 주시기를 진심으로 바랍니다.

중국에서 가장 활발한 AI 컴파일러 커뮤니티를 만들어 봐요! 마지막으로 현장 단체 사진도 공유할게요❤️

주최자 및 파트너

HyperAI(hyper.ai)는 국제적으로 선도적인 인공 지능 및 고성능 컴퓨팅 커뮤니티로서, 업계 정보 보고서, 가속화된 데이터 세트 다운로드, 온라인 튜토리얼 데모, 인기 있는 모델 성능 평가, 최첨단 논문 권장 사항, 고가치 결과 해석, 최고의 컨퍼런스 일정 통합과 같은 일련의 서비스를 제공하여 글로벌 데이터 과학 및 인공 지능 산업의 개발자와 애호가들이 학습하고 이해하고 실습할 수 있도록 돕고, 커뮤니티와 함께 인공 지능의 미래를 구축하는 것을 목표로 합니다.

공식 웹사이트를 방문하세요:https://hyper.ai/

OpenBayes Bayesian Computing은 중국을 대표하는 고성능 컴퓨팅 서비스 제공업체입니다.기존 소프트웨어 생태계와 머신 러닝 모델을 차세대 이기종 칩에 접목하여 산업체와 대학의 과학 연구에 더 빠르고 사용하기 쉬운 데이터 과학 컴퓨팅 제품을 제공합니다. 해당 제품은 수십 개의 대규모 산업 시나리오나 주요 과학 연구 기관에서 채택되었습니다.

공식 웹사이트를 방문하세요:https://openbayes.com/

MLC.AI 커뮤니티는 2022년 6월에 설립되었습니다. Apache TVM의 주요 발명가이자 머신 러닝 분야의 저명한 젊은 학자인 천톈치가 팀을 이끌고 MLC 온라인 과정을 시작했으며, 이를 통해 머신 러닝 컴파일의 핵심 요소와 핵심 개념을 체계적으로 소개했습니다.

2022년 11월, MLC.AI 커뮤니티 자원봉사자들의 공동 노력으로 최초의 완전한 TVM 중국어 문서가 출시되어 HyperAI 공식 웹사이트에 성공적으로 호스팅되었습니다. 이를 통해 머신 러닝 컴파일에 관심이 있는 국내 개발자에게 새로운 기술인 문서에 접근하고 학습할 수 있는 기본 설정을 제공하게 되었습니다.

MLC 온라인 과정:https://mlc.ai/

TVM 중국어 문서:https://tvm.hyper.ai/

2011년 4월에 설립된 가라지 커피(Garage Coffee)는 중국에서 초기 단계의 인터넷 스타트업에 집중하는 가장 초기 기업 중 하나입니다. 가라지 커피는 "대규모 창업"이라는 개념을 기반으로 초기 단계의 기업가들을 위한 저렴하고 편리한 풀팩터(full-factor) 오픈 혁신 및 창업 서비스 플랫폼을 구축했습니다.

베이징 중관촌 창업가 최초의 메이커스페이스인 가라지 커피(Garage Coffee)는 커피숍을 인터랙티브 미디어로 활용하여 창업팀에게 공유, 공동 홍보, 통합, 공존을 위한 인터랙티브 오피스 공간과 인큐베이션 서비스를 제공합니다. 가라지 커피는 세계 최초의 기업가 정신을 테마로 한 커피숍이자, 중국에서 가장 영향력 있는 국내 메이커스페이스이자 국제적인 혁신 및 창업 플랫폼입니다.

이벤트 지원

PPT 받기:위챗 공개 계정 "HyperAI Super Neuro"를 팔로우하고 키워드 "0705 AI Compiler"에 답글을 달면 공인 강사의 발표 PPT를 받으실 수 있습니다.

QR 코드를 스캔하여 이벤트 그룹에 참여하세요⬇️

Command Palette

이벤트 리뷰 | AMD/Muxi Integrated Circuit/ByteDance/Peking University: 하드웨어 전반의 통합 컴파일 생태계 심층 분석

이벤트 콘텐츠 리뷰

2025년 AI 컴파일러를 만나보세요 · 계속 지켜봐주세요

주최자 및 파트너