HyperAI초신경

이벤트 리뷰 | 상하이교통대학교/중국과학원 컴퓨팅기술연구소/마이크로소프트 아시아연구소/지위안에서 실무 정보 공유 및 제5회 Meet AI 컴파일러 기술 살롱 성황리 마무리

特色图像

이번 행사를 위해 우리는 상하이 교통대학, 중국과학원 컴퓨팅기술연구소, 마이크로소프트 아시아 연구소, 베이징 인공지능 아카데미의 AI 컴파일러 전문가 몇 명을 초대하게 되어 영광이었습니다. 그들은 최신 연구 결과를 발표했을 뿐만 아니라, 풍부한 응용 사례를 결합하여 수백 명의 참석자에게 심층적이고 이해하기 쉬운 기술 공유를 제공했습니다.

행사 당일 날씨는 매우 더웠지만, 참가자들의 열정은 조금도 식지 않았습니다. 현장 토론 분위기는 매우 활발했고, 이를 통해 모두가 AI 컴파일러 기술에 대해 더 깊이 생각하게 되었습니다. 개방적이고 포용적인 커뮤니티인 HyperAI는 모든 사람을 한자리에 모으고 AI 컴파일러 기술 개발을 촉진하는 고품질 학술 교류 플랫폼을 제공하게 되어 매우 기쁩니다.

더 많은 친구들이 우리 AI 컴파일러 가족에 합류하여 우리와 함께 AI 컴파일러 기술의 무한한 가능성을 탐험해 보시기 바랍니다!

이벤트 콘텐츠 리뷰

다음은 이벤트에 대한 간략한 소개와 이벤트에 대한 비디오 리뷰입니다.

주제 공유:MLCEngine: 범용 LLM 배포 엔진

내용물:이 공유에서는 다양한 플랫폼에 보편적으로 배포할 수 있는 LLM 엔진인 MLCEngine을 소개합니다. MLCEngine은 서버에서 높은 처리량과 낮은 지연 시간의 LLM 제공 기능을 제공할 뿐만 아니라, 오늘날의 고품질 대규모 언어 모델을 다양한 로컬 환경에 원활하게 배포할 수 있도록 지원합니다.

비디오 공유:

【2024 AI 컴파일러를 만나다】Feng Siyuan-MLCEngine: 범용 LLM 배포 엔진_哔哩哔哩_bilibili​www.bilibili.com/video/BV1Ji421Y7je/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

주제 공유:ElasticRoom: 리소스 제한 컴파일 및 강력한 우선 순위 스케줄링을 통한 공동 설계를 통한 다중 테넌트 DNN 추론 엔진


내용물:런타임 소프트웨어의 GPU 리소스 분할 메커니즘은 작업 스케줄러와 멀티 테넌트 컴퓨팅 시스템에서 리소스 활용도와 처리량을 개선하는 데 널리 사용되었습니다. 그러나 기존의 GPU 리소스 분할 메커니즘은 일괄 이기종 DNN 추론 요청에 직면할 때 GPU 리소스 활용도를 향상시키고 실시간 요청에 대한 낮은 지연 시간을 동시에 보장할 수 없습니다.우리는 TVM을 기반으로 리소스가 제한된 컴파일을 구축하고 우선순위 스케줄링을 통해 실시간 요청에 대해 높은 GPU 활용도와 낮은 지연 시간을 모두 달성하는 혁신적인 멀티 테넌트 DNN 추론 엔진인 ElasticRoom을 제안합니다.

비디오 공유:

【2024년 AI 컴파일러 만나기】Ma Lixian-ElasticRoom: 다중 테넌트 DNN 추론 엔진_哔哩哔哩_bilibili​www.bilibili.com/video/BV1uE421P7zm/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

주제 공유:Triton 기반의 대규모 모델 연산자 라이브러리인 FlagGems는 혁신적인 관행입니다.

내용물:OpenAI의 Triton 언어를 기반으로 PyTorch 프레임워크에서 대규모 모델에 대한 추론 및 학습 가속을 제공하는 고성능 일반 연산자 라이브러리인 FlagGems를 개발했습니다. Triton의 프로그래밍 특성을 고려하여 런타임 최적화와 자동 코드 생성이라는 두 가지 기술 혁신을 적용했습니다. 이를 통해 연산자의 표현력을 확장하고 성능을 개선했습니다.

비디오 공유:

https://www.bilibili.com/video/BV1ES421R7o7/?vd_source=5e54209e1f8c68b7f1dc3df8aabf 856c​www.bilibili.com/video/BV1ES421R7o7/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

2024 AI 컴파일러 · 곧 출시

제6회 2024 Meet AI Compiler Technical Salon은 연말 상하이에서 개최될 예정입니다. 우리는 모든 기업과 지역 사회 파트너가 다양한 형태로 공동 창조에 참여하기를 진심으로 요청합니다. 강사 추천부터 행사장 및 티 브레이크 후원까지, 우리는 모두 환영합니다.

중국에서 가장 활성화된 AI 컴파일러 커뮤니티를 만들기 위해 함께 노력합시다! 마지막으로 현장 단체사진 공유해요❤️

주최자 및 파트너

HyperAI는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.이 플랫폼은 가속화된 데이터 세트 다운로드, 온라인 튜토리얼 데모, 심층적인 논문 해석, 최고의 컨퍼런스 일정 통합 등 다양한 인프라를 제공하여 중국의 데이터 과학 및 인공지능 산업에 종사하는 개발자와 애호가들이 학습하고 이해하고 실습할 수 있도록 돕고, 커뮤니티와 함께 인공지능의 미래를 구축하는 것을 목표로 합니다. 현재 SuperNeural 공식 웹사이트는 수천 개의 고전적이고 고품질의 공개 데이터 세트와 튜토리얼을 출시했으며, 중국에서 가장 활발한 AI 컴파일러 커뮤니티를 운영하고 있습니다.

공식 웹사이트를 방문하세요:https://hyper.ai/

OpenBayes Bayesian Computing은 중국을 대표하는 고성능 컴퓨팅 서비스 제공업체입니다.기존 소프트웨어 생태계와 머신 러닝 모델을 차세대 이기종 칩에 접목하여 산업체와 대학의 과학 연구에 더 빠르고 사용하기 쉬운 데이터 과학 컴퓨팅 제품을 제공합니다. 해당 제품은 수십 개의 대규모 산업 시나리오나 주요 과학 연구 기관에서 채택되었습니다.

공식 웹사이트를 방문하세요:https://openbayes.com/

MLC.AI 커뮤니티는 2022년 6월에 설립되었습니다. Apache TVM의 주요 발명가이자 머신 러닝 분야의 저명한 젊은 학자인 천톈치가 팀을 이끌고 MLC 온라인 과정을 시작했으며, 이를 통해 머신 러닝 컴파일의 핵심 요소와 핵심 개념을 체계적으로 소개했습니다.

2022년 11월, MLC.AI 커뮤니티 자원봉사자들의 공동 노력으로 최초의 완전한 TVM 중국어 문서가 출시되어 HyperAI 공식 웹사이트에 성공적으로 호스팅되었습니다. 이를 통해 머신 러닝 컴파일에 관심이 있는 국내 개발자에게 새로운 기술인 문서에 접근하고 학습할 수 있는 기본 설정을 제공하게 되었습니다.

MLC 온라인 과정:https://mlc.ai/

TVM 중국어 문서:https://tvm.hyper.ai/

중국과학원(ICT) 산하 컴퓨팅기술연구소는 1956년에 설립되었으며, 컴퓨터 과학과 기술 분야에서 포괄적인 연구를 수행하는 중국 최초의 학술기관입니다.컴퓨터기술연구소는 우리나라 최초의 범용 디지털 전자컴퓨터를 성공적으로 개발하여 우리나라 고성능 컴퓨터의 연구개발 기반을 마련했습니다. 우리나라 최초의 범용 CPU 칩도 여기서 탄생했습니다.

컴퓨터기술연구소는 우리나라 컴퓨터 산업의 요람입니다. 컴퓨팅 기술 연구소의 발전과 함께 우리나라 최초의 컴퓨팅 기술 전문가 수백 명을 양성했으며, 20명 이상의 학자들이 이곳에서 일하거나 공부했습니다. 학문과 기술이 발전함에 따라 컴퓨팅기술연구소에서 시안 마이크로전자연구소, 컴퓨팅센터, 소프트웨어연구소, 네트워크센터, 마이크로전자연구소, 정보공정연구소 등 여러 연구소가 분리되었고, 레노버, 던, 룽손, 캠브리안 등 첨단기술 기업이 탄생했습니다.

HPC 기술 위원회(중국컴퓨터연맹, CCF TCHPC로 약칭)는 2005년 중국컴퓨터연맹의 승인을 받아 설립되었습니다. 중국컴퓨터연맹 산하 전문위원회로서 고성능 컴퓨팅 분야의 학술 연구를 담당하는 권위 있는 조직으로, 고성능 컴퓨팅 분야의 학술대회를 개최하고 산학 응용 서비스를 제공합니다.

"학술 플랫폼 구축, 산업 교류 촉진, 응용 구현 추진, 소프트웨어 및 하드웨어 생태계 균형, 산업 발전에 기여, 산업, 학계, 연구 및 응용 연결"이라는 원칙과 사명에 따라, 우리는 중국 고성능 컴퓨팅 분야의 연구 개발을 촉진하고 고성능 컴퓨팅 학술 및 산업 협력 교류 플랫폼을 구축하는 데 전념하고 있습니다. 과학기술 발전과 혁신을 뒷받침하고, 사회 진보를 촉진하며, 우리나라의 종합적 국력과 국제 경쟁력을 강화하는 데 있어서 대체할 수 없는 중요한 역할과 의의를 가지고 있습니다.

PPT 받기:위챗 공개 계정 "HyperAI Super Neuro"를 팔로우하고, 백그라운드에서 "AI Compiler Beijing"이라는 키워드로 답글을 달면 게스트의 PPT 전문을 받을 수 있습니다.