2ヶ月前

LEGO：テンソル応用における空間的加速器生成と最適化

Yujun Lin Zhekai Zhang Song Han

要約

現代のテンソル処理アプリケーション、特に基礎モデルおよび生成型AIアプリケーションは、視覚情報と自然言語といった複数の入力モダリティを扱う必要があり、柔軟なアクセラレータアーキテクチャの需要を高めている。既存のフレームワークは、アーキテクチャ設計の柔軟性とRTL（Register-Transfer Level）コード生成の生産性の間にトレードオフが生じており、手書きのテンプレートに限定される場合や、自動的にRTLを生成できない場合がある。この課題に対処するため、本研究ではテンソル処理アプリケーションを対象としたLEGOフレームワークを提案する。LEGOは、手書きのRTL設計テンプレートを一切不要とし、空間アーキテクチャの設計を自動的に生成し、合成可能なRTLコードを出力する。LEGOのフロントエンドはアフィン変換に基づくアーキテクチャ表現を活用し、機能ユニット間の接続関係を探索し、メモリシステムを合成するとともに、データ再利用解析に基づいて異なる空間データフロー設計を統合する。その後、バックエンドはプリミティブレベルのグラフ表現としてハードウェアを扱い、低レベルの最適化を実行し、線形計画法を用いてパイプラインレジスタの最適挿入を行い、空間データフロー間の切り替え時に無駄な論理回路のオーバーヘッドを低減する。評価結果から、LEGOは従来のGemminiと比較して3.2倍の高速化と2.4倍のエネルギー効率向上を達成でき、生成型AIアプリケーションにおける多様な現代的な基礎モデルに対応する1つのアーキテクチャを生成可能であることが示された。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング

すぐに使える GPU

最適価格

今すぐ始める

Hyper Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

LEGO：テンソル応用における空間的加速器生成と最適化

Yujun Lin Zhekai Zhang Song Han

要約

AI で AI を構築

Hyper Newsletters