4 つのミートアップ、3 つの都市、19 人のゲスト、1,000 人以上の業界関係者、累計 100 万件以上の露出、2023 年、AI コンパイラー コミュニティはその存在感を少し刷新し、非常にニッチな分野で最も垂直的な開発者とエンジニアを発掘し、0 から 1 までの小さな拠点を確立し、コミュニケーション プラットフォームを構築し、社内の協力と接続を促進しました。生態系の上流と下流。
2024年も半ばを迎えましたが、大型モデルがテクノロジー界の「注目リスト」を占め続けている今日、7月6日(土)は中国科学院計算技術研究所に来ます。Meet AIコンパイラ技術サロンの第5回オフライン集会を開催しました。
今回のMeetupは、技術共有とラウンドテーブルディスカッションの2部構成で、ゲストは上海交通大学、計算技術研究所、マイクロソフトリサーチアジア、北京智源人工知能研究所の方々です。新しい集まりは誰もが新しいスキルを身につけ、同じ業界の新しい友達を作ることができます。
イベント詳細
⏰時間:7月6日(土)13:30~18:00
場所: 北京市海淀区科学院南路6号、中国科学院計算技術研究所1階講堂
定員:200名(当日は席に限りがございますのでお早めにお申込みください)
登録:下のQRコードをスキャンして登録してください
イベント グループに参加するには、QR コードをスキャンして「AI Compiler」をメモします。
議題:
セッション1 ゲストを共有する
トピックを共有:MLCEngine: ユニバーサル LLM 導入エンジン
内容の紹介: この共有では、さまざまなプラットフォームに汎用的に展開できる LLM エンジンである MLCEngine を紹介します。 MLCEngine は、サーバー上で高スループット、低遅延の LLM サービス機能を備えているだけでなく、さまざまなローカル環境での今日の高品質の大規模言語モデルのシームレスな展開もサポートしています。
この共有を見ると、次のことが理解できるでしょう。
1. MLCEngineの設計思想と使い方
2. ユニバーサル展開の意味
3. LLM推論エンジン開発への思い
トピックを共有:ElasticRoom: リソースに制約のあるコンパイルと強力な優先順位スケジューリングによる共同設計によるマルチテナント DNN 推論エンジン
内容紹介:ランタイム ソフトウェアの GPU リソース パーティショニング メカニズムは、リソースの使用率とスループットを向上させるために、ジョブ スケジューラやマルチテナント コンピューティング システムで広く使用されています。ただし、既存の GPU リソース パーティショニング メカニズムでは、バッチ異種 DNN 推論リクエストに直面した場合に、GPU リソースの使用率を向上させることと、リアルタイム リクエストの低レイテンシを確保することを同時に行うことはできません。私たちは革新的なマルチテナント DNN 推論エンジン ElasticRoom を提案します。これは、TVM に基づいてリソース制約のコンパイルを構築し、同時に優先スケジューリングを通じて高い GPU 使用率とリアルタイム リクエストの低レイテンシを実現します。
この共有を見ると、次のことが理解できるでしょう。
1. GPUリソース管理とタスクスケジューリング
2. TVMベースのリソース制約コンパイル
トピックを共有:タイル抽象化に基づいた効率的な深層学習コンパイル システム
内容紹介:深層学習アルゴリズムとハードウェアの急速な発展に伴い、業界では効率的かつ高速なモデル展開に対する要求が高まっており、深層学習コンパイラーはモデル計算式と基盤となるハードウェア実行を接続する新しい方法となっています。ただし、さまざまなハードウェア上で迅速に開発される深層学習アプリケーションを効率的にサポートする方法には、まだ多くの課題があります。この共有では、統合タイル抽象化に基づく深層学習コンパイルの分野における一連の探索的作業を紹介します。
この共有を見ると、次のことが理解できるでしょう。
1. ブロック (タイル) 抽象化に基づく深層学習コンパイル スタック
2. ディープ ラーニング アプリケーション シナリオで、ブロック (タイル) 抽象化を通じてグローバル メモリ アクセス効率を最適化する方法
3. 深層学習アプリケーションのシナリオで、ブロック (タイル) 抽象化を通じて低精度の深層学習計算をサポートする方法
トピックを共有:Triton に基づく大規模なモデル オペレーター ライブラリである FlagGems の革新的な実践
内容紹介:をベースに OpenAI Triton 言語については、PyTorch フレームワークの下で大規模なモデルの推論とトレーニングを高速化するために、高性能ユニバーサル オペレーター ライブラリである FlagGems を開発しました。Triton のプログラミング特性を考慮し、実行時の最適化と自動コード生成という 2 つの技術革新を適用して、演算子の表現能力を拡張し、パフォーマンスを向上させました。
この共有を見ると、次のことが理解できるでしょう。
1. Triton プログラミング言語を理解し、Triton オープンソース エコシステムに触れる
2. FlagGems オペレーター ライブラリとその開発の進捗状況を理解する
3. FlagGemsに適用されている実行時最適化技術と自動コード生成技術を理解する
セッション2 ラウンドテーブルセッション
ラウンドテーブルのテーマ:Transformer 時代の異種間チップコンパイルの最適化
HyperAI は、中国を代表する人工知能およびハイパフォーマンス コンピューティング コミュニティです。データセットの高速ダウンロード、オンラインチュートリアルのデモンストレーション、論文の詳細な解釈、会議カレンダーの統合などのさまざまなインフラストラクチャを提供することで、中国のデータサイエンスおよび人工知能業界の開発者や愛好家が学び、理解し、実践できるよう支援することを目的としています。 . コミュニティと協力して人工知能の未来を築きましょう。現在、HyperAI の公式 Web サイトでは、何千もの古典的で高品質な公開データ セットとチュートリアルが公開されており、中国で最も活発な AI コンパイラー コミュニティを運営しています。HyperAI は、この一連のイベントの唯一の主催者でもあります。
公式ウェブサイトにアクセスしてください:https://hyper.ai/
OpenBayes は、中国の大手ハイパフォーマンス コンピューティング サービス プロバイダーです。古典的なソフトウェア エコロジーと機械学習モデルを新世代の異種チップに移植することにより、産業界や大学の科学研究向けに、より高速で使いやすいデータ サイエンス コンピューティング製品を提供します。その製品は、数十の大規模な産業シナリオや大学で使用されています。主要な科学研究機関が採用。
公式ウェブサイトにアクセスしてください:https://openbayes.com/
MLC.AI コミュニティは、2022 年 6 月に設立されました。Apache TVM の主な発明者であり、機械学習の分野で有名な若い学者である Chen Tianqi がチームを率いて、主要な要素とコアを体系的に紹介する MLC オンライン コースを立ち上げました。機械学習コンパイルの概念。
2022 年 11 月、MLC.AI コミュニティ ボランティアの共同の努力により、最初の完全な TVM 中国語ドキュメントがオンラインで公開され、HyperAI Super Neural 公式 Web サイトで正常にホストされました。これにより、機械学習のコンパイルに関心のある国内開発者にさらに多くの情報を提供できるようになりました。新しいテクノロジーの基礎、つまりドキュメントを学びます。
MLC オンライン コース:https://mlc.ai/
TVM 中国語ドキュメント:https://tvm.hyper.ai/
中国科学院計算機技術研究所(計算機技術研究所と称する)は 1956 年に設立され、コンピュータ科学技術の総合研究を専門とする中国初の学術機関です。計算機研究所は我が国初の汎用デジタル電子コンピュータの開発に成功し、我が国初の高性能コンピュータの研究開発拠点を形成し、我が国初の汎用CPUチップもここで誕生しました。
コンピューティング技術研究所は、我が国のコンピューター産業の発祥の地です。コンピューティング研究所の発展により、この国のために数百人の初期のコンピューティング技術専門家が訓練され、20 人以上の学者がここで働いたり学んだりしてきました。専門分野と技術の発展に伴い、西安マイクロエレクトロニクス研究所、コンピューティングセンター、ソフトウェア研究所、ネットワークセンター、マイクロエレクトロニクス研究所、情報技術研究所などのいくつかの研究機関がコンピューティング研究所から徐々に分離され、レノボ、スゴンを育成しました。 、ロンソン、カンブリアン、その他のハイテク企業。
HPC技術委員会(中国コンピュータ連盟、略称CCF TCHPC)は、中国コンピュータ連盟の承認を得て2005年に設立された、中国コンピュータ連盟傘下の専門委員会として、ハイパフォーマンスに関する学術研究・組織組織です。コンピューティング分野における学術会議および産学アプリケーション サービスの権威ある組織。
「学術プラットフォームの構築、産業交流の促進、アプリケーションの導入促進、ソフトウェアとハードウェアのバランスの取れた環境、産業の発展への奉仕、産学研究の連携」という理念と使命に沿って、研究と研究の推進に取り組んでいます。中国におけるハイパフォーマンスコンピューティング分野の発展とハイパフォーマンスコンピューティング学術、産業協力および交流プラットフォームの構築は、科学技術の発展と革新を支援し、社会の進歩を促進し、我が国の総合力を高める上でかけがえのない役割と重要性を果たしています。国力と国際競争力。
2011 年 6 月、中国科学院は青少年イノベーション促進協会(以下、「青少年促進協会」という)を正式に設立しました。これは、中国科学院の革新的な取り組みであり、青少年の科学技術人材を総合的に育成します。効果的な組織と支援を通じて、研究所全体の若い科学技術従事者を団結させ、学術的視野を広げ、相互交流と学際的な研究を促進し、科学研究活動を組織する能力を強化し、新しい世代を育成することを目的としています。学術的および技術的リーダーの集まりです。
イベントサポート
アクティビティ行:QRコードをスキャンしてイベントラインにジャンプして登録してください
イベントグループに参加するには、QR コードをスキャンして「2024 AI Compiler」をメモしてください
このイベントのスペースの状況を考慮して、参加枠は 200 名のみとさせていただきますので、できるだけ早くお申込みいただき、座席を確保することをお勧めします。
7月6日13:30~17:40に新旧の友人が集まるのを楽しみにしています!