HyperAI超神经

NextSilicon今日正式推出其64位数据流引擎Maverick-2，标志着该公司历经八年、累计融资3.03亿美元后，终于实现核心技术的量产落地。Maverick-2采用创新的“智能计算架构”（ICA），旨在颠覆传统冯·诺依曼架构的局限，专为高性能计算（HPC）场景打造，同时兼容AI应用。该架构的核心是高度可重构的数据流引擎，将计算单元（ALU）直接映射至软件逻辑，实现“代码即硬件”的编程模式。Maverick-2芯片采用5纳米工艺，单芯片含540亿晶体管，分为四个计算区域，每区域由多个计算块组成，每个计算块包含数百个ALU，整体可实现数万至十万级并行计算单元。与传统CPU仅2%面积用于计算、98%用于控制和数据调度不同，Maverick-2将大部分硅片资源用于实际计算，显著降低控制开销。 Maverick-2还搭配自研RISC-V处理器Arbel，作为系统主机。Arbel采用完全自主设计的RISC-V核心，具备10路指令解码、6个整数ALU和4个128位浮点单元，支持16条标量指令并行执行，配备64KB L1指令/数据缓存和1MB L2缓存，性能宣称可与英特尔LionCove和AMD Zen5核心媲美。关键技术亮点在于其自动化编译与优化系统。开发者无需手动移植代码至CUDA或ROCm，只需将C/C++/Fortran代码的中间表示（IR）输入，Maverick-2的编译器即可自动将其映射为“毫核”（mill core）结构，并在运行中持续分析、优化数据流路径，实现“自适应调优”。该系统可动态部署多个副本以并行处理热点代码，具备类似FPGA的灵活性，但无需人工编程。在性能测试中，Maverick-2表现亮眼：在GUPS测试中达32.6 GUPS，功耗460瓦，较CPU快22倍、GPU快6倍；STREAM测试中实现5.2 TB/s内存带宽，为GPU的1.86倍每瓦；HPCG测试中达600 GFLOPS，功耗600瓦，性能媲美领先GPU但功耗减半；PageRank图计算任务性能为“领先GPU”的10倍。 Maverick-2将率先部署于桑迪亚国家实验室，该机构曾参与其前身Maverick-1的研发。未来，NextSilicon计划通过扩展互连技术实现多芯片协同，构建“超级芯片”系统。尽管峰值浮点性能尚不及NVIDIA H100等顶级GPU，但其在持续性能、能效和内存效率方面的优势，使其在HPC与AI混合负载场景中极具竞争力。

相关链接

相关链接

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

Command Palette

NextSilicon 推出 Maverick-2 数据流引擎，强势进军 CPU 与 GPU 市场

相关链接

Command Palette

NextSilicon 推出 Maverick-2 数据流引擎，强势进军 CPU 与 GPU 市场

相关链接

Command Palette

NextSilicon 推出 Maverick-2 数据流引擎，强势进军 CPU 与 GPU 市场

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征