2023 年の Meet TVM シリーズ イベントでは、合計 4 回の Meetup が開催されました。3 つの異なる都市に拠点を置き、さまざまな業界から 19 人の AI コンパイラーの専門家が素晴らしい情報を共有するために招待され、学界と産業界から 1,000 名を超える参加者が集まりました。
2024 年に新しくアップグレードされた Meet AI Compiler が準備完了です。最初のオフライン Meetup は 7 月 6 日に中国科学院計算技術研究所で開催されます。この Meetup には、上海交通大学、計算技術研究所、中国科学院、マイクロソフト リサーチ アジアなどから多くの上級 AI コンパイラー専門家を招待することができて幸いです。彼らは素晴らしいテーマの共有とラウンドテーブル ディスカッションを提供し、協力していきます。実装シナリオにおける AI コンパイラー テクノロジーの応用と画期的な進歩について話し合います。
イベント詳細
⏰時間:7月6日(土)13:30~17:40
場所: 北京市海淀区科学院南路6号、中国科学院計算技術研究所1階講堂
中国科学院計算技術研究所
北京市海淀区中関村科学院路6号
定員:200名(当日は席に限りがございますのでお早めにお申込みください)
登録:下のQRコードをスキャンして登録してください
イベント グループに参加するには、QR コードをスキャンして「AI Compiler」をメモします。
議題:
ゲストを共有する
トピックを共有:MLCEngine: ユニバーサル LLM 導入エンジン
内容の紹介: この共有では、さまざまなプラットフォームに汎用的に展開できる LLM エンジンである MLCEngine を紹介します。 MLCEngine は、サーバー上で高スループット、低遅延の LLM サービス機能を備えているだけでなく、さまざまなローカル環境での今日の高品質の大規模言語モデルのシームレスな展開もサポートしています。
この共有を見ると、次のことが理解できるでしょう。
1. MLCEngineの設計思想と使い方
2. ユニバーサル展開の意味
3. LLM推論エンジン開発への思い
トピックを共有:ElasticRoom: リソースに制約のあるコンパイルと強力な優先順位スケジューリングによる共同設計によるマルチテナント DNN 推論エンジン
内容紹介:ランタイム ソフトウェアの GPU リソース パーティショニング メカニズムは、リソースの使用率とスループットを向上させるために、ジョブ スケジューラやマルチテナント コンピューティング システムで広く使用されています。ただし、既存の GPU リソース パーティショニング メカニズムでは、バッチ異種 DNN 推論リクエストに直面した場合に、GPU リソースの使用率を向上させることと、リアルタイム リクエストの低レイテンシを確保することを同時に行うことはできません。私たちは革新的なマルチテナント DNN 推論エンジン ElasticRoom を提案します。これは、TVM に基づいてリソース制約のコンパイルを構築し、同時に優先スケジューリングを通じて高い GPU 使用率とリアルタイム リクエストの低レイテンシを実現します。
この共有を見ると、次のことが理解できるでしょう。
1. GPUリソース管理とタスクスケジューリング
2. TVMベースのリソース制約コンパイル
トピックを共有:タイル抽象化に基づいた効率的な深層学習コンパイル システム
内容紹介:深層学習アルゴリズムとハードウェアの急速な発展に伴い、業界では効率的かつ高速なモデル展開に対する要求が高まっており、深層学習コンパイラーはモデル計算式と基盤となるハードウェア実行を接続する新しい方法となっています。ただし、さまざまなハードウェア上で迅速に開発される深層学習アプリケーションを効率的にサポートする方法には、まだ多くの課題があります。この共有では、統合タイル抽象化に基づく深層学習コンパイルの分野における一連の探索的作業を紹介します。
この共有を見ると、次のことが理解できるでしょう。
1. ブロック (タイル) 抽象化に基づく深層学習コンパイル スタック
2. ディープ ラーニング アプリケーション シナリオで、ブロック (タイル) 抽象化を通じてグローバル メモリ アクセス効率を最適化する方法
3. 深層学習アプリケーションのシナリオで、ブロック (タイル) 抽象化を通じて低精度の深層学習計算をサポートする方法
スポンサーとパートナー
HyperAI は、中国を代表する人工知能およびハイパフォーマンス コンピューティング コミュニティです。データセットの高速ダウンロード、オンラインチュートリアルのデモンストレーション、論文の詳細な解釈、会議カレンダーの統合などのさまざまなインフラストラクチャを提供することで、中国のデータサイエンスおよび人工知能業界の開発者や愛好家が学び、理解し、実践できるよう支援することを目的としています。 . コミュニティと協力して人工知能の未来を築きましょう。現在、Super Neural 公式 Web サイトでは、数千の古典的で高品質な公開データ セットとチュートリアルを公開しており、中国で最も活発な AI コンパイラ コミュニティを運営しています。
公式ウェブサイトにアクセスしてください:https://hyper.ai/
OpenBayes は中国の大手ハイパフォーマンス コンピューティング サービス プロバイダーです古典的なソフトウェア エコロジーと機械学習モデルを新世代の異種チップに移植することにより、産業界や大学の科学研究向けに、より高速で使いやすいデータ サイエンス コンピューティング製品を提供します。その製品は、数十の大規模産業で使用されています。シナリオまたは大手科学研究会社によって使用されます。
公式ウェブサイトにアクセスしてください:https://openbayes.com/
MLC.AI コミュニティは、2022 年 6 月に設立されました。Apache TVM の主な発明者であり、機械学習の分野で有名な若い学者である Chen Tianqi がチームを率いて、主要な要素とコアを体系的に紹介する MLC オンライン コースを立ち上げました。機械学習コンパイルの概念。
2022 年 11 月、MLC.AI コミュニティ ボランティアの共同の努力により、最初の完全な TVM 中国語ドキュメントがオンラインで公開され、HyperAI Super Neural 公式 Web サイトで正常にホストされました。これにより、機械学習のコンパイルに関心のある国内開発者にさらに多くの情報を提供できるようになりました。新しいテクノロジーの基礎、つまりドキュメントを学びます。
MLC オンライン コース:https://mlc.ai/
TVM 中国語ドキュメント:https://tvm.hyper.ai/
中国科学院計算機技術研究所(計算機技術研究所と称する)は 1956 年に設立され、コンピュータ科学技術の総合研究を専門とする中国初の学術機関です。計算機研究所は我が国初の汎用デジタル電子コンピュータの開発に成功し、我が国初の高性能コンピュータの研究開発拠点を形成し、我が国初の汎用CPUチップもここで誕生しました。
コンピューティング技術研究所は、我が国のコンピューター産業の発祥の地です。コンピューティング研究所の発展により、この国のために数百人の初期のコンピューティング技術専門家が訓練され、20 人以上の学者がここで働いたり学んだりしてきました。専門分野と技術の発展に伴い、西安マイクロエレクトロニクス研究所、コンピューティングセンター、ソフトウェア研究所、ネットワークセンター、マイクロエレクトロニクス研究所、情報技術研究所などのいくつかの研究機関がコンピューティング研究所から徐々に分離され、レノボ、スゴンを育成しました。 、ロンソン、カンブリアン、その他のハイテク企業。
HPC技術委員会(中国コンピュータ連盟、略称CCF TCHPC)は、中国コンピュータ連盟の承認を得て2005年に設立された、中国コンピュータ連盟傘下の専門委員会として、ハイパフォーマンスに関する学術研究・組織組織です。コンピューティング分野における学術会議および産学アプリケーション サービスの権威ある組織。
「学術プラットフォームの構築、産業交流の促進、アプリケーションの導入促進、ソフトウェアとハードウェアのバランスの取れた環境、産業の発展への奉仕、産学研究の連携」という理念と使命に沿って、研究と研究の推進に取り組んでいます。中国におけるハイパフォーマンスコンピューティング分野の発展とハイパフォーマンスコンピューティング学術、産業協力および交流プラットフォームの構築は、科学技術の発展と革新を支援し、社会の進歩を促進し、我が国の総合力を高める上でかけがえのない役割と重要性を果たしています。国力と国際競争力。
2011 年 6 月、中国科学院は青少年イノベーション促進協会(以下、「青少年促進協会」という)を正式に設立しました。これは、中国科学院の革新的な取り組みであり、青少年の科学技術人材を総合的に育成します。効果的な組織と支援を通じて、研究所全体の若い科学技術従事者を団結させ、学術的視野を広げ、相互交流と学際的な研究を促進し、科学研究活動を組織する能力を強化し、新しい世代を育成することを目的としています。学術的および技術的リーダーの集まりです。
アクティビティ行:QRコードをスキャンしてイベントラインにジャンプして登録してください
イベントグループに参加するには、QR コードをスキャンして「2024 AI Compiler」をメモしてください
このイベントのスペースの状況を考慮して、参加枠は 200 名のみとさせていただきますので、できるだけ早くお申込みいただき、座席を確保することをお勧めします。
7月6日13:30~17:40に北京で皆さんにお会いできるのを楽しみにしています。