HyperAIHyperAI

Command Palette

Search for a command to run...

英伟达Blackwell领跑首个智能体AI基础设施基准测试

近日,行业首个智能体AI基准测试AgentPerf公布首批结果。测试显示,英伟达Blackwell Ultra NVL72平台在智能体AI工作负载中表现领先,其每兆瓦能耗下可运行的智能体数量较上一代Hopper架构提升20倍。与传统对话式AI不同,智能体AI需通过多次大模型调用与工具交互完成复杂任务,其负载复杂度呈指数级增长。现有评测标准无法准确衡量此类需求。AgentPerf基于真实编程智能体轨迹构建,通过模拟多步推理与工具调用,精准评估系统在响应速度、并发能力及能效方面的实际表现。英伟达GB300 NVL72凭借全栈协同设计实现性能突破。该平台将72颗GPU整合为单机架系统,配合CUDA内核优化与TensorRT LLM推理引擎,有效掩盖跨专家通信延迟,大幅提升并发处理效率。在20与60 tokens每秒的服务级别目标下,GB300 NVL72均展现出显著的能效优势。目前,Baseten、DeepInfra及Together AI等合作伙伴已基于Blackwell平台部署DeepSeek V4 Pro等大模型,为Cursor、Pam.ai等生产级智能体应用提供实时推理支持。随着英伟达Vera Rubin架构全面投产及软件生态持续优化,智能体AI基础设施的算力密度与经济性将进一步跃升,为企业规模化落地AI智能体提供坚实底座。

相关链接