HyperAI超神经
Back to Headlines

Pegatron 推出 128 颗 AMD Instinct MI350X 加速器的高性能 AI 训练和推理平台

17 hours ago

今年5月,在Computex展览会上,全球知名电子制造服务商Pegatron展示了一项基于128个AMD下一代Instinct MI350X加速器的独特机架规模解决方案,该方案旨在应对高性能计算(HPC)和人工智能(AI)推理及训练应用程序的高需求。这一系统领先于AMD自家设计的一代,将在未来一年里帮助Pegatron积累经验,为推出基于MI350X的新一代IF64和IF128解决方案打下基础。 Pegatron的AS501-4A1/AS500-4A1机架规模系统由八个5U计算托盘组成,每个托盘配备一个AMD EPYC 9005系列处理器和四个AMD Instinct MI350X AI及HPC加速器。系统采用了液体冷却技术,确保在高负载情况下能够保持最高且稳定的性能。机器遵循51OU ORV3标准形式,适用于依赖OCP标准的云计算数据中心,如Meta公司所使用的。 由于AMD目前没有专属的Infinity Fabric连接开关,该系统通过400GbE以太网连接不同机箱中的GPU。这种架构与Nvidia的GB200/GB300 NVL72平台形成鲜明对比,后者使用了自家的超高速NVLink连接,能够支持多达72个GPU。因此,Pegatron的MI350X系统在扩展能力上可能稍显不足。然而,每颗MI350X加速器支持高达288GB的HBM3E内存,使得整个系统拥有36.8TB的高速内存,能够支持比Nvidia当前Blackwell系列GPU更大的AI模型。 从理论上讲,Pegatron的128个GPU机架规模系统峰值可达1,177PFLOPS(每秒千万亿次浮点运算),主要用于AI推理。该系统的内存容量和计算能力使其成为一项强大的解决方案,尤其是在需要处理大规模数据集的场景中。尽管其GPU间通信受限,但该系统仍然在多实例训练和其他高性能计算任务中表现出色。 对于Pegatron而言,这款新系统不仅能满足现有客户的计算需求,还为其积累了宝贵的经验,为未来更加先进的AMD Instinct MI400系列解决方案铺平了道路。Pegatron作为一家知名的电子制造服务商,已经为苹果等一线品牌提供了多年的服务。此次推出的解决方案表明,公司在高性能计算和AI领域的战略布局正在加速推进。 业内人士认为,Pegatron的这次创新不仅是对AMD硬件能力的一次展示,更是对公司软件优化和系统集成能力的考验。该系统如果能够成功应用于实际场景,将有望挑战Nvidia在机架规模AI解决方案领域的主导地位,推动市场格局进一步多元化。

Related Links