HyperAIHyperAI

Command Palette

Search for a command to run...

4日前
AMD
GPU

Intel・AMDがx86向けAI演算指令セット「ACE」公開

インテルとAMDは近日中、x86プロセッサ向けにAIワークロードを効率化するための新拡張命令セット「ACE」の完全仕様を公開した。ACEは既存のAVX10レジスタを活用しつつ、行列演算専用に設計されたハードウェア回路を追加することで、CPU上での機械学習処理における電力効率と処理密度を大幅に向上させることを目的としている。 従来のAI推論は主にGPUが担うが、小規模モデルや単一ユーザー向けの低遅延タスク、あるいはGPUが搭載されていない環境ではCPUの活用が有効である。ただし、行列乗算演算をAVX10の命令で処理するのは本来の設計意図から外れており、電力消費が多く演算効率が課題となっていた。ACEは入力ベクトルあたりAVX10の最大16倍の演算を実現し、命令オーバーヘッドを削減するとともにメモリアクセスの効率化も期待できる。 技術的には、ACEはベンダー非依存の設計を採用しており、PyTorchやTensorFlowといった機械学習フレームワークはハードウェア依存の分岐を排除し、単一のコードパスで最適化できる。INT8やFP8、FP16、FP32、BF16などの主要なデータ型に加え、Open Compute ProjectのMXブロックスケーリング形式もネイティブサポートする。これにより、各NPUの仕様に依存していた処理をCPUへ移行させるケースでも、x86アーキテクチャ上で統一された開発環境が提供される。 インテルとAMDは今後、ACE命令セット専用にシリコンリソースを割り当てたプロセッサ設計を進めると見られる。CPU上でAI推論を効率化できる標準が確立されることで、データセンターからエッジデバイスまで、ワークロードの柔軟な配置と電力消費の最適化が進むと期待されている。

関連リンク