HyperAI超神経

イベントレビュー | 上海交通大学/中国科学院計算技術研究所/Microsoft Asia Research/Zhiyuan 多くの著名人が有益な情報を共有し、第 5 回 Meet AI Compiler テクニカル サロンは成功裡に終了しました

特色图像

このイベントには、上海交通大学、中国科学院計算技術研究所、マイクロソフト リサーチ アジア、北京知源人工知能研究所から多数の AI コンパイラーの専門家を招待することができました。彼らは最新の技術をもたらしただけではありません。研究結果を豊富なアプリケーション実践と組み合わせることで、出席した何百人もの参加者に詳細かつシンプルなテクノロジー共有を提供しました。

当日は非常に蒸し暑い天候でしたが、参加者の熱意は全く衰えず、現場の議論は非常に活発な雰囲気で、AIコンパイラ技術について皆でより深く考えるきっかけとなりました。 。 オープンで包括的なコミュニティとして、HyperAI は皆を結集させ、AI コンパイラー テクノロジーの開発を支援する高品質の学術交流プラットフォームを提供できることを非常に嬉しく思っています。

もっと多くのお友達が AI コンパイラー ファミリーに参加し、私たちと一緒に AI コンパイラー テクノロジーの無限の可能性を探求することを歓迎します。

活動内容のレビュー

以下はイベントの紹介とイベントのレビュー動画です。

トピックを共有:MLCEngine: ユニバーサル LLM 導入エンジン

内容紹介:この共有により、さまざまなプラットフォームに汎用的に展開できる LLM エンジンである MLCEngine が導入されます。 MLCEngine は、サーバー上で高スループット、低遅延の LLM サービス機能を備えているだけでなく、さまざまなローカル環境での今日の高品質の大規模言語モデルのシームレスな展開もサポートしています。

ビデオを共有する:

【2024 年 AI コンパイラーの紹介】Feng Siyuan-MLCEngine: ユニバーサル LLM デプロイメント エンジン_bilibili_bilibili www.bilibili.com/video/BV1Ji421Y7je/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

トピックを共有:ElasticRoom: リソースに制約のあるコンパイルと強力な優先順位スケジューリングによる共同設計によるマルチテナント DNN 推論エンジン


内容紹介:ランタイム ソフトウェアの GPU リソース パーティショニング メカニズムは、リソースの使用率とスループットを向上させるために、ジョブ スケジューラやマルチテナント コンピューティング システムで広く使用されています。ただし、既存の GPU リソース パーティショニング メカニズムでは、バッチ異種 DNN 推論リクエストに直面した場合に、GPU リソースの使用率を向上させることと、リアルタイム リクエストの低レイテンシを確保することを同時に行うことはできません。私たちは革新的なマルチテナント DNN 推論エンジン ElasticRoom を提案します。これは、TVM に基づいてリソース制約のコンパイルを構築し、同時に優先スケジューリングを通じて高い GPU 使用率とリアルタイム リクエストの低レイテンシを実現します。

ビデオを共有する:

【2024年 AI コンパイラーの紹介】Ma Lixian-ElasticRoom: マルチテナント DNN 推論エンジン_bilibili_bilibili www.bilibili.com/video/BV1uE421P7zm/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

トピックを共有:Triton に基づく大規模なモデル オペレーター ライブラリである FlagGems の革新的な実践

内容紹介:OpenAI の Triton 言語に基づいて、PyTorch フレームワークの下で大規模なモデルの推論とトレーニングの高速化を実現するために、高性能の汎用演算子ライブラリである FlagGems を開発しました。 Triton のプログラミング特性を考慮して、実行時の最適化と自動コード生成という 2 つの技術革新を適用して、演算子の表現機能を拡張し、パフォーマンスを向上させました。

ビデオを共有する:

https://www.bilibili.com/video/BV1ES421R7o7/?vd_source=5e54209e1f8c68b7f1dc3df8aabf 856c www.bilibili.com/video/BV1ES421R7o7/?vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

2024 AI コンパイラー · 乞うご期待

2024 年の第 6 回テクニカル サロン Meet AI Compiler は、年末に上海で開催される予定です。講師の推薦や会場のスポンサーなど、さまざまな形での共創にご参加いただけるすべての企業およびコミュニティ パートナーを心から歓迎いたします。コーヒーブレイクも大歓迎です。

一緒に中国で最も活発な AI コンパイラ コミュニティを作りましょう!最後に、現場の大きな写真をシェアします❤️

スポンサーとパートナー

HyperAI は、中国を代表する人工知能およびハイパフォーマンス コンピューティング コミュニティです。データセットの高速ダウンロード、オンラインチュートリアルのデモンストレーション、論文の詳細な解釈、会議カレンダーの統合などのさまざまなインフラストラクチャを提供することで、中国のデータサイエンスおよび人工知能業界の開発者や愛好家が学び、理解し、実践できるよう支援することを目的としています。 . コミュニティと協力して人工知能の未来を築きましょう。現在、Super Neural 公式 Web サイトでは、数千の古典的で高品質な公開データ セットとチュートリアルを公開しており、中国で最も活発な AI コンパイラ コミュニティを運営しています。

公式ウェブサイトにアクセスしてください:https://hyper.ai/

OpenBayes は中国の大手ハイパフォーマンス コンピューティング サービス プロバイダーです古典的なソフトウェア エコロジーと機械学習モデルを新世代の異種チップに移植することにより、産業界や大学の科学研究向けに、より高速で使いやすいデータ サイエンス コンピューティング製品を提供します。その製品は、数十の大規模産業で使用されています。シナリオまたは大手科学研究会社によって使用されます。

公式ウェブサイトにアクセスしてください:https://openbayes.com/

MLC.AI コミュニティは、2022 年 6 月に設立されました。Apache TVM の主な発明者であり、機械学習の分野で有名な若い学者である Chen Tianqi がチームを率いて、主要な要素とコアを体系的に紹介する MLC オンライン コースを立ち上げました。機械学習コンパイルの概念。

2022 年 11 月、MLC.AI コミュニティ ボランティアの共同の努力により、最初の完全な TVM 中国語ドキュメントがオンラインで公開され、HyperAI Super Neural 公式 Web サイトで正常にホストされました。これにより、機械学習のコンパイルに関心のある国内開発者にさらに多くの情報を提供できるようになりました。新しいテクノロジーの基礎、つまりドキュメントを学びます。

MLC オンライン コース:https://mlc.ai/

TVM 中国語ドキュメント:https://tvm.hyper.ai/

中国科学院計算機技術研究所(計算機技術研究所と称する)は 1956 年に設立され、コンピュータ科学技術の総合研究を専門とする中国初の学術機関です。計算機研究所は我が国初の汎用デジタル電子コンピュータの開発に成功し、我が国初の高性能コンピュータの研究開発拠点を形成し、我が国初の汎用CPUチップもここで誕生しました。

コンピューティング技術研究所は、我が国のコンピューター産業の発祥の地です。コンピューティング研究所の発展により、この国のために数百人の初期のコンピューティング技術専門家が訓練され、20 人以上の学者がここで働いたり学んだりしてきました。専門分野と技術の発展に伴い、西安マイクロエレクトロニクス研究所、コンピューティングセンター、ソフトウェア研究所、ネットワークセンター、マイクロエレクトロニクス研究所、情報技術研究所などのいくつかの研究機関がコンピューティング研究所から徐々に分離され、レノボ、スゴンを育成しました。 、ロンソン、カンブリアン、その他のハイテク企業。

HPC技術委員会(中国コンピュータ連盟、略称CCF TCHPC)は、中国コンピュータ連盟の承認を得て2005年に設立された、中国コンピュータ連盟傘下の専門委員会として、ハイパフォーマンスに関する学術研究・組織組織です。コンピューティング分野における学術会議および産学アプリケーション サービスの権威ある組織。

「学術プラットフォームの構築、産業交流の促進、アプリケーションの導入促進、ソフトウェアとハードウェアのバランスの取れた環境、産業の発展への奉仕、産学研究の連携」という理念と使命に沿って、研究と研究の推進に取り組んでいます。中国におけるハイパフォーマンスコンピューティング分野の発展とハイパフォーマンスコンピューティング学術、産業協力および交流プラットフォームの構築は、科学技術の発展と革新を支援し、社会の進歩を促進し、我が国の総合力を高める上でかけがえのない役割と重要性を果たしています。国力と国際競争力。

PPT を入手:WeChatの公開アカウント「HyperAI Super Neural」をフォローし、バックグラウンドでキーワード「AI Compiler北京」に返信すると、ゲストの完全なPPTを入手できます。