巴西斥资42亿美元升级“桑托斯·杜蒙特”超级计算机,迈向AI强国之路
巴西政府近日宣布了一项雄心勃勃的计划,旨在为其人工智能(AI)发展奠定硬件基础。这一名为“巴西人工智能计划”(BPIA)的项目于2024年7月启动,目标在2025年至2028年间投资约230亿雷亚尔(约合42亿美元),用以建立自主的AI算力基础设施。该项目不仅包括建造高性能计算(HPC)系统,还涵盖开发本土AI模型,减少对外国技术和模型的依赖。尽管这笔资金对于美国或中国的超大规模企业和云服务提供商来说并不算多,但对于任何希望实现AI主权的国家政府来说,这已经是一笔巨大的投资。 作为这一计划的一部分,巴西最大的科学计算设施——位于里约热内卢州的国家科学计算实验室(LNCC)最近对其超级计算机“桑托斯·杜蒙特”进行了重大升级。桑托斯·杜蒙特最初在2015年安装,当时的性能为1.1 petaflops,成本约为5000万到6000万雷亚尔。2019年,该系统进行了首次升级,性能提升至1.5 petaflops,由巴西石油巨头Petrobras资助。最新的这次升级于2024年3月宣布,耗资1亿雷亚尔(约合1940万美元),将桑托斯·杜蒙特的FP64浮点运算性能提升至18.85 petaflops,几乎是十年前初始系统的6.75倍。Petrobras再次为此次升级提供了资金支持,但具体拥有多少机器容量尚不清楚。 这次升级特别值得注意的是其混合架构设计和对不同供应商技术的兼容性。升级后的桑托斯·杜蒙特共有五个分区,分别使用了来自Nvidia和AMD的CPU和GPU。第一分区由62个XH3145-H刀片组成,每个刀片配备两颗Intel Sapphire Rapids Xeon 4处理器和四颗Nvidia Hopper H100 GPU加速器。第二分区有20个XH3420刀片,每块刀片包含三个节点,每个节点则配备两颗96核AMD Genoa-X Epyc 9684X CPU。第三分区由36个节点组成,每个节点包含四个通过NVLink 4互连的Nvidia Grace CG100和Hopper H100 GPU,形成共享内存配置。第四分区有六块刀片,每块刀片包含三个节点,每个节点配备两颗AMD Antares MI300A混合CPU-GPU计算引擎(与劳伦斯利弗莫尔国家实验室的“酋长岩”超级计算机使用的相同)。第五分区有四个节点,每个节点安装了两颗Nvidia Grace-Grace超级芯片。 这种混合架构设计表明,LNCC希望在未来的大规模收购中探索多种技术方案,同时也能够利用现有的混合计算资源处理更复杂和高效的HPC和AI任务。当前的升级虽然没有达到理想中的400 petaflops,但考虑到BPIA的整体预算,未来仍有望建造更大规模的计算系统。 业内人士认为,巴西的这一系列举措显示了其在全球科技格局中追求更高地位的决心。作为一个拥有2.13万亿美元GDP和2.15亿人口的南美最大经济体,巴西在高性能计算和人工智能领域的发展潜力巨大。Eviden,即Atos的HPC部门,作为这次升级的主要供应商,在推动巴西进入全球先进计算领域方面发挥了重要作用。不过,要实现BPIA的目标,巴西仍需要继续加大投入和技术研发力度。 总的来说,巴西政府通过BPIA和近期的桑托斯·杜蒙特超级计算机升级,迈出了建立自主AI能力的重要一步,为未来更强大的计算系统和本土模型开发奠定了基础。