NextSilicon 推出 Maverick-2 数据流引擎,强势进军 CPU 与 GPU 市场
NextSilicon今日正式推出其64位数据流引擎Maverick-2,标志着该公司历经八年、累计融资3.03亿美元后,终于实现核心技术的量产落地。Maverick-2采用创新的“智能计算架构”(ICA),旨在颠覆传统冯·诺依曼架构的局限,专为高性能计算(HPC)场景打造,同时兼容AI应用。 该架构的核心是高度可重构的数据流引擎,将计算单元(ALU)直接映射至软件逻辑,实现“代码即硬件”的编程模式。Maverick-2芯片采用5纳米工艺,单芯片含540亿晶体管,分为四个计算区域,每区域由多个计算块组成,每个计算块包含数百个ALU,整体可实现数万至十万级并行计算单元。与传统CPU仅2%面积用于计算、98%用于控制和数据调度不同,Maverick-2将大部分硅片资源用于实际计算,显著降低控制开销。 Maverick-2还搭配自研RISC-V处理器Arbel,作为系统主机。Arbel采用完全自主设计的RISC-V核心,具备10路指令解码、6个整数ALU和4个128位浮点单元,支持16条标量指令并行执行,配备64KB L1指令/数据缓存和1MB L2缓存,性能宣称可与英特尔LionCove和AMD Zen5核心媲美。 关键技术亮点在于其自动化编译与优化系统。开发者无需手动移植代码至CUDA或ROCm,只需将C/C++/Fortran代码的中间表示(IR)输入,Maverick-2的编译器即可自动将其映射为“毫核”(mill core)结构,并在运行中持续分析、优化数据流路径,实现“自适应调优”。该系统可动态部署多个副本以并行处理热点代码,具备类似FPGA的灵活性,但无需人工编程。 在性能测试中,Maverick-2表现亮眼:在GUPS测试中达32.6 GUPS,功耗460瓦,较CPU快22倍、GPU快6倍;STREAM测试中实现5.2 TB/s内存带宽,为GPU的1.86倍每瓦;HPCG测试中达600 GFLOPS,功耗600瓦,性能媲美领先GPU但功耗减半;PageRank图计算任务性能为“领先GPU”的10倍。 Maverick-2将率先部署于桑迪亚国家实验室,该机构曾参与其前身Maverick-1的研发。未来,NextSilicon计划通过扩展互连技术实现多芯片协同,构建“超级芯片”系统。尽管峰值浮点性能尚不及NVIDIA H100等顶级GPU,但其在持续性能、能效和内存效率方面的优势,使其在HPC与AI混合负载场景中极具竞争力。
