HyperAIHyperAI

Command Palette

Search for a command to run...

4 天前
AMD
GPU

英特尔与AMD发布ACE指令集,提升x86 AI矩阵计算能效

近日,英特尔与AMD正式联合发布ACE指令集扩展规范,旨在为x86处理器赋予高效的人工智能计算能力。该标准依托现有AVX10寄存器架构,通过集成专用矩阵运算硅片,从根本上优化了CPU处理AI负载的能效比与计算密度。相比传统AVX10指令,ACE在同等输入向量下可执行约16倍运算量,有效削减指令开销并提升内存带宽利用率。 作为硬件中立型标准,ACE使PyTorch与TensorFlow等主流机器学习框架仅需维护单一代码路径,彻底消除底层硬件差异带来的开发壁垒。指令集原生兼容INT8、FP8、FP16、FP32、BF16等核心数据类型,并原生支持OCP的MX块缩放格式,大幅拓宽算法适配边界。 该规范的落地将显著重塑端侧AI部署格局。面对小规模模型推理或高实时性单用户任务,ACE方案可规避数据在CPU与GPU间反复搬运的性能损耗。其统一的跨架构一致性设计,更使部分NPU专属负载得以无缝迁移至通用处理器,大幅降低系统适配成本。随着双巨头持续投入底层算力,ACE正逐步确立为x86生态应对端侧AI浪潮的关键技术底座。

相关链接

英特尔与AMD发布ACE指令集,提升x86 AI矩阵计算能效 | 热门资讯 | HyperAI超神经