Command Palette
Search for a command to run...
Yujun Lin Zhekai Zhang Song Han

要約
現代のテンソル処理アプリケーション、特に基礎モデルおよび生成型AIアプリケーションは、視覚情報と自然言語といった複数の入力モダリティを扱う必要があり、柔軟なアクセラレータアーキテクチャの需要を高めている。既存のフレームワークは、アーキテクチャ設計の柔軟性とRTL(Register-Transfer Level)コード生成の生産性の間にトレードオフが生じており、手書きのテンプレートに限定される場合や、自動的にRTLを生成できない場合がある。この課題に対処するため、本研究ではテンソル処理アプリケーションを対象としたLEGOフレームワークを提案する。LEGOは、手書きのRTL設計テンプレートを一切不要とし、空間アーキテクチャの設計を自動的に生成し、合成可能なRTLコードを出力する。LEGOのフロントエンドはアフィン変換に基づくアーキテクチャ表現を活用し、機能ユニット間の接続関係を探索し、メモリシステムを合成するとともに、データ再利用解析に基づいて異なる空間データフロー設計を統合する。その後、バックエンドはプリミティブレベルのグラフ表現としてハードウェアを扱い、低レベルの最適化を実行し、線形計画法を用いてパイプラインレジスタの最適挿入を行い、空間データフロー間の切り替え時に無駄な論理回路のオーバーヘッドを低減する。評価結果から、LEGOは従来のGemminiと比較して3.2倍の高速化と2.4倍のエネルギー効率向上を達成でき、生成型AIアプリケーションにおける多様な現代的な基礎モデルに対応する1つのアーキテクチャを生成可能であることが示された。