HyperAI

4 天前

近日，英特尔与AMD正式联合发布ACE指令集扩展规范，旨在为x86处理器赋予高效的人工智能计算能力。该标准依托现有AVX10寄存器架构，通过集成专用矩阵运算硅片，从根本上优化了CPU处理AI负载的能效比与计算密度。相比传统AVX10指令，ACE在同等输入向量下可执行约16倍运算量，有效削减指令开销并提升内存带宽利用率。作为硬件中立型标准，ACE使PyTorch与TensorFlow等主流机器学习框架仅需维护单一代码路径，彻底消除底层硬件差异带来的开发壁垒。指令集原生兼容INT8、FP8、FP16、FP32、BF16等核心数据类型，并原生支持OCP的MX块缩放格式，大幅拓宽算法适配边界。该规范的落地将显著重塑端侧AI部署格局。面对小规模模型推理或高实时性单用户任务，ACE方案可规避数据在CPU与GPU间反复搬运的性能损耗。其统一的跨架构一致性设计，更使部分NPU专属负载得以无缝迁移至通用处理器，大幅降低系统适配成本。随着双巨头持续投入底层算力，ACE正逐步确立为x86生态应对端侧AI浪潮的关键技术底座。

此资讯由 AI 智能聚合生成，旨在高效传递行业动态，不代表任何观点或建议。

相关链接

相关链接

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

Command Palette

英特尔与AMD发布ACE指令集，提升x86 AI矩阵计算能效

相关链接

Command Palette

英特尔与AMD发布ACE指令集，提升x86 AI矩阵计算能效

相关链接

Command Palette

英特尔与AMD发布ACE指令集，提升x86 AI矩阵计算能效

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征